Logotipo de Zephyrnet

Presentación de la tecnología transformadora de IA detrás de Watsonx Orders – Blog de IBM

Fecha:


Presentación de la tecnología transformadora de IA detrás de Watsonx Orders – Blog de IBM



Se vierte salsa BBQ sobre una hamburguesa abierta

Te diriges a tu autoservicio favorito para comer papas fritas y una hamburguesa con queso. Es un pedido sencillo y cuando entras te das cuenta de que no hay mucha cola. ¿Qué podría salir mal? Infinidad.

El restaurante está cerca de una autopista muy transitada con mucho ruido de tráfico y aviones que vuelan a baja altura a medida que se acercan al aeropuerto cercano. Hace viento. El estéreo del coche que viene detrás de ti suena a todo volumen y el cliente del carril de al lado intenta hacer un pedido al mismo tiempo que tú. La cacofonía desafiaría incluso al humano más experimentado en recibir órdenes.

Con IBM® watsonx™ Orders, hemos creado un agente de voz con tecnología de inteligencia artificial para recibir pedidos desde el auto sin intervención humana. El producto utiliza tecnología de punta para aislar y comprender la voz humana en condiciones ruidosas y al mismo tiempo respalda una conversación natural y fluida entre el cliente que realiza el pedido y el agente de voz.

Watsonx Orders entiende el habla y entrega órdenes

IBM watsonx Orders comienza el proceso cuando detecta que un vehículo se acerca al puesto del orador. Saluda a los clientes y les pregunta qué les gustaría pedir. Luego escucha para procesar el audio entrante y aislar la voz humana. A partir de ahí, detecta el pedido y los artículos, luego muestra al cliente lo que escuchó en el tablero del menú digital. Si el cliente dice que todo parece correcto, watsonx Orders envía el pedido al punto de venta y a la cocina. Finalmente, la cocina prepara la comida. El proceso de pedido completo se muestra en la siguiente figura:

Hay tres partes para comprender el pedido de un cliente. La primera parte consiste en aislar la voz humana e ignorar los sonidos ambientales conflictivos. La segunda parte es comprender el habla, incluida la complejidad de los acentos, los coloquialismos, las emociones y las declaraciones erróneas. Finalmente, la tercera parte consiste en traducir los datos del habla en una acción que refleje la intención del cliente.

Aislando la voz humana

Cuando llama a su banco o compañía de servicios públicos, un chatbot de agente de voz probablemente responde primero a la llamada para preguntarle por qué llama. Ese chatbot espera un audio relativamente silencioso de un teléfono con poco o ningún ruido de fondo.

En el drive-thru siempre habrá ruido de fondo. No importa qué tan bueno sea el hardware de audio, las voces humanas pueden quedar ahogadas por ruidos fuertes, como la bocina de un tren que pasa.

Como watsonx Orders captura audio en tiempo real, utiliza técnicas de aprendizaje automático para realizar la cancelación digital de ruido y eco. Ignora los ruidos del viento, la lluvia, el tráfico en las autopistas y los aeropuertos. Otros desafíos relacionados con el ruido incluyen ruidos de fondo inesperados y conversaciones cruzadas, donde las personas hablan de fondo durante una orden. Watsonx Orders utiliza técnicas avanzadas para minimizar estas interrupciones.

comprensión del habla

La mayoría de los chatbots de voz comenzaron como chatbots de texto. Los agentes de voz tradicionales primero convierten las palabras habladas en texto escrito y luego analizan la oración escrita para descubrir qué quiere el hablante.

Esto es computacionalmente lento y un desperdicio. En lugar de intentar primero transcribir sonidos en palabras y oraciones, Watsonx Orders convierte el habla en fonemas (las unidades de sonido más pequeñas del habla que transmiten un significado distinto). Por ejemplo, cuando dices "agitar", Watsonx Orders analiza esa palabra en "sh", "ay" y "k". Convertir el habla en fonemas, en lugar de texto completo en inglés, también aumenta la precisión sobre diferentes acentos y respalda activamente un flujo de conversación en tiempo real al reducir la latencia intradiálogo.

Traducir la comprensión en acción

A continuación, Watsonx Orders identifica la intención, como "quiero" o "cancelar eso". Luego identifica los elementos que pertenecen a comandos como "hamburguesa con queso" o "tarta de manzana".

Existen varias técnicas de aprendizaje automático para el reconocimiento de intenciones. La última técnica utiliza modelos de lenguaje amplios y básicos, que teóricamente pueden comprender cualquier pregunta y responder con una respuesta adecuada. Esto es demasiado lento y costoso desde el punto de vista computacional para casos de uso restringidos por hardware. Si bien podría ser impresionante para un agente de voz de autoservicio responder: "¿Por qué el cielo es azul?", ralentizaría el autoservicio, frustraría a las personas en la fila y disminuiría los ingresos.

Watsonx Orders utiliza un modelo muy específico que está optimizado para comprender los cientos de millones de formas en que se puede pedir una hamburguesa con queso, como "Sin cebolla, con poca salsa especial o con más tomates". El modelo también permite a los clientes modificar el menú a mitad del pedido: "En realidad, esa hamburguesa no tiene tomates".

En producción, watsonx Orders puede completar más del 90% de los pedidos por sí solo sin ninguna intervención humana. Vale la pena señalar que otros proveedores en este espacio utilizan centros de contacto con operadores humanos para tomar el control cuando el agente de IA se atasca y cuentan la interacción como "automatizada". Según nuestros estándares de IBM watsonx Orders, "automatizado" significa manejar un pedido de un extremo a otro sin la participación humana.

La implementación en el mundo real genera ganancias

Durante las horas pico, Watsonx Orders puede manejar más de 150 automóviles por hora en un restaurante de doble carril, lo cual es mejor que la mayoría de los tomadores de pedidos humanos. Más automóviles por hora significa más ingresos y ganancias, por lo que nuestros enfoques de ingeniería y modelado optimizan constantemente esta métrica.

Watsonx Orders ha recibido 60 millones de pedidos del mundo real en docenas de restaurantes, incluso con ruido, conversaciones cruzadas y complejidad de pedidos desafiantes. Creamos la plataforma para adaptarla fácilmente a nuevos menús, pilas de tecnología de restaurantes y sistemas de gestión de menús centralizados con la esperanza de poder trabajar con todas las cadenas de restaurantes de servicio rápido en todo el mundo.

Mantenga su restaurante funcionando sin problemas con IA que maneja los pedidos más difíciles

¿Le resultó útil este artículo?

No


Más de Inteligencia artificial




Tecnología minorista y trabajadores de primera línea: brindar experiencias inolvidables al cliente

2 min leerLa industria minorista emplea a millones de personas, y los empleados minoristas de próxima generación se verán significativamente afectados por el aumento de la IA generativa. Creo firmemente que el comercio minorista tradicional, sin importar la categoría de producto, se basa en tres pilares esenciales para el éxito: Miembros del equipo orgullosos, bien capacitados y comprometidos con trayectorias profesionales claras. Una marca profundamente arraigada en sólidos valores culturales. La columna vertebral de una tecnología superior ¿Le falta alguno de estos elementos? La magia simplemente no sucede. Entra IBM. Su enfoque para aprovechar la tecnología...




Los casos de uso de IA más valiosos para las empresas

10 min leerAl pensar en los casos de uso de la inteligencia artificial (IA), cabe preguntarse: ¿Qué no podrá hacer la IA? La respuesta fácil es principalmente trabajo manual, aunque podría llegar el día en que gran parte de lo que ahora es trabajo manual se realice mediante dispositivos robóticos controlados por IA. Pero ahora mismo, la IA pura se puede programar para muchas tareas que requieren pensamiento e inteligencia, siempre y cuando esa inteligencia pueda recopilarse digitalmente y usarse para entrenar una IA...




IBM Tech Now: 12 de febrero de 2024

<1 min leer​Bienvenido IBM Tech Now, nuestra serie web de videos que presenta las últimas y mejores noticias y anuncios en el mundo de la tecnología. Asegúrese de suscribirse a nuestro canal de YouTube para recibir una notificación cada vez que se publique un nuevo vídeo de IBM Tech Now. IBM Tech Now: Episodio 92 En este episodio, cubrimos los siguientes temas: Los GRAMMY + IBM watsonx Conexión de audio con IA generativa Manténgase conectado Puede consultar los anuncios del blog de IBM para obtener un resumen completo de...




Casos de uso de IA generativa para la empresa

9 min leer¿Recuerdas lo bien que te sentiste cuando sostuviste por primera vez un teléfono inteligente en tu mano? El diseño compacto y la interactividad táctil parecían un salto hacia el futuro. En poco tiempo, los teléfonos inteligentes se convirtieron en una forma de vida para las organizaciones de todo el mundo debido a todo lo que ofrecen para la productividad y la comunicación empresarial. La IA generativa (inteligencia artificial) promete un salto similar en productividad y la aparición de nuevos modos de trabajar y crear. Herramientas como Midjourney y ChatGPT están ganando atención por sus capacidades...

Boletines informativos de IBM

Obtenga nuestros boletines y actualizaciones de temas que brindan el liderazgo intelectual más reciente y conocimientos sobre tendencias emergentes.

Subscribirme Ahora

Más boletines

punto_img

Información más reciente

punto_img