Te diriges a tu autoservicio favorito para comer papas fritas y una hamburguesa con queso. Es un pedido sencillo y cuando entras te das cuenta de que no hay mucha cola. ¿Qué podría salir mal? Infinidad.
El restaurante está cerca de una autopista muy transitada con mucho ruido de tráfico y aviones que vuelan a baja altura a medida que se acercan al aeropuerto cercano. Hace viento. El estéreo del coche que viene detrás de ti suena a todo volumen y el cliente del carril de al lado intenta hacer un pedido al mismo tiempo que tú. La cacofonía desafiaría incluso al humano más experimentado en recibir órdenes.
Con IBM® watsonx™ Orders, hemos creado un agente de voz con tecnología de inteligencia artificial para recibir pedidos desde el auto sin intervención humana. El producto utiliza tecnología de punta para aislar y comprender la voz humana en condiciones ruidosas y al mismo tiempo respalda una conversación natural y fluida entre el cliente que realiza el pedido y el agente de voz.
Watsonx Orders entiende el habla y entrega órdenes
IBM watsonx Orders comienza el proceso cuando detecta que un vehículo se acerca al puesto del orador. Saluda a los clientes y les pregunta qué les gustaría pedir. Luego escucha para procesar el audio entrante y aislar la voz humana. A partir de ahí, detecta el pedido y los artículos, luego muestra al cliente lo que escuchó en el tablero del menú digital. Si el cliente dice que todo parece correcto, watsonx Orders envía el pedido al punto de venta y a la cocina. Finalmente, la cocina prepara la comida. El proceso de pedido completo se muestra en la siguiente figura:
Hay tres partes para comprender el pedido de un cliente. La primera parte consiste en aislar la voz humana e ignorar los sonidos ambientales conflictivos. La segunda parte es comprender el habla, incluida la complejidad de los acentos, los coloquialismos, las emociones y las declaraciones erróneas. Finalmente, la tercera parte consiste en traducir los datos del habla en una acción que refleje la intención del cliente.
Aislando la voz humana
Cuando llama a su banco o compañía de servicios públicos, un chatbot de agente de voz probablemente responde primero a la llamada para preguntarle por qué llama. Ese chatbot espera un audio relativamente silencioso de un teléfono con poco o ningún ruido de fondo.
En el drive-thru siempre habrá ruido de fondo. No importa qué tan bueno sea el hardware de audio, las voces humanas pueden quedar ahogadas por ruidos fuertes, como la bocina de un tren que pasa.
Como watsonx Orders captura audio en tiempo real, utiliza técnicas de aprendizaje automático para realizar la cancelación digital de ruido y eco. Ignora los ruidos del viento, la lluvia, el tráfico en las autopistas y los aeropuertos. Otros desafíos relacionados con el ruido incluyen ruidos de fondo inesperados y conversaciones cruzadas, donde las personas hablan de fondo durante una orden. Watsonx Orders utiliza técnicas avanzadas para minimizar estas interrupciones.
comprensión del habla
La mayoría de los chatbots de voz comenzaron como chatbots de texto. Los agentes de voz tradicionales primero convierten las palabras habladas en texto escrito y luego analizan la oración escrita para descubrir qué quiere el hablante.
Esto es computacionalmente lento y un desperdicio. En lugar de intentar primero transcribir sonidos en palabras y oraciones, Watsonx Orders convierte el habla en fonemas (las unidades de sonido más pequeñas del habla que transmiten un significado distinto). Por ejemplo, cuando dices "agitar", Watsonx Orders analiza esa palabra en "sh", "ay" y "k". Convertir el habla en fonemas, en lugar de texto completo en inglés, también aumenta la precisión sobre diferentes acentos y respalda activamente un flujo de conversación en tiempo real al reducir la latencia intradiálogo.
Traducir la comprensión en acción
A continuación, Watsonx Orders identifica la intención, como "quiero" o "cancelar eso". Luego identifica los elementos que pertenecen a comandos como "hamburguesa con queso" o "tarta de manzana".
Existen varias técnicas de aprendizaje automático para el reconocimiento de intenciones. La última técnica utiliza modelos de lenguaje amplios y básicos, que teóricamente pueden comprender cualquier pregunta y responder con una respuesta adecuada. Esto es demasiado lento y costoso desde el punto de vista computacional para casos de uso restringidos por hardware. Si bien podría ser impresionante para un agente de voz de autoservicio responder: "¿Por qué el cielo es azul?", ralentizaría el autoservicio, frustraría a las personas en la fila y disminuiría los ingresos.
Watsonx Orders utiliza un modelo muy específico que está optimizado para comprender los cientos de millones de formas en que se puede pedir una hamburguesa con queso, como "Sin cebolla, con poca salsa especial o con más tomates". El modelo también permite a los clientes modificar el menú a mitad del pedido: "En realidad, esa hamburguesa no tiene tomates".
En producción, watsonx Orders puede completar más del 90% de los pedidos por sí solo sin ninguna intervención humana. Vale la pena señalar que otros proveedores en este espacio utilizan centros de contacto con operadores humanos para tomar el control cuando el agente de IA se atasca y cuentan la interacción como "automatizada". Según nuestros estándares de IBM watsonx Orders, "automatizado" significa manejar un pedido de un extremo a otro sin la participación humana.
La implementación en el mundo real genera ganancias
Durante las horas pico, Watsonx Orders puede manejar más de 150 automóviles por hora en un restaurante de doble carril, lo cual es mejor que la mayoría de los tomadores de pedidos humanos. Más automóviles por hora significa más ingresos y ganancias, por lo que nuestros enfoques de ingeniería y modelado optimizan constantemente esta métrica.
Watsonx Orders ha recibido 60 millones de pedidos del mundo real en docenas de restaurantes, incluso con ruido, conversaciones cruzadas y complejidad de pedidos desafiantes. Creamos la plataforma para adaptarla fácilmente a nuevos menús, pilas de tecnología de restaurantes y sistemas de gestión de menús centralizados con la esperanza de poder trabajar con todas las cadenas de restaurantes de servicio rápido en todo el mundo.
Mantenga su restaurante funcionando sin problemas con IA que maneja los pedidos más difíciles
¿Le resultó útil este artículo?
SíNo
Más de Inteligencia artificial
Boletines informativos de IBM
Obtenga nuestros boletines y actualizaciones de temas que brindan el liderazgo intelectual más reciente y conocimientos sobre tendencias emergentes.
Subscribirme Ahora
Más boletines
- Distribución de relaciones públicas y contenido potenciado por SEO. Consiga amplificado hoy.
- PlatoData.Network Vertical Generativo Ai. Empodérate. Accede Aquí.
- PlatoAiStream. Inteligencia Web3. Conocimiento amplificado. Accede Aquí.
- PlatoESG. Carbón, tecnología limpia, Energía, Ambiente, Solar, Gestión de residuos. Accede Aquí.
- PlatoSalud. Inteligencia en Biotecnología y Ensayos Clínicos. Accede Aquí.
- Fuente: https://www.ibm.com/blog/unveiling-the-transformative-ai-technology-behind-watsonx-orders/