Logotipo de Zephyrnet

Cómo creamos una aplicación de Asistente de Google galardonada

Fecha:


Logotipo de TRT World News Quiz
News Quiz para TRT World ha combinado la voz humana con la tecnología de asistente de voz inteligente para crear la mejor experiencia de usuario.
Furkan Akyurek

Prueba de noticias de TRT World Recientemente ganó premios en dos categorías separadas en Google Actions Challenge. Nuestro cuestionario evalúa el conocimiento del usuario sobre los eventos actuales con nuevas preguntas todos los días y existe tanto en Google Home como en Amazon Alexa.

Se necesitaron muchas iteraciones para llegar allí. Nos enfrentamos a desafíos inesperados, ya que desarrollar una aplicación para una interfaz de voz requiere una mentalidad diferente. Este artículo detallará nuestro proceso para llegar al producto final y las lecciones que aprendimos. Como uno de los primeros en llegar a la voz asistente plataforma en la industria de los medios, nos gustaría compartir algunas de las prácticas que desarrollamos a lo largo del camino.

Después de recibir nuestro primer Google Home a fines de 2016, comenzamos a pensar en ideas únicas para esta nueva plataforma. Nuestro primer paso fue investigar qué estaban haciendo nuestros competidores. Curiosamente, solo vimos 30 aplicaciones en las plataformas, excluyendo los resúmenes de noticias. Una categoría que nos llamó la atención fueron los cuestionarios. Como un concepto antiguo, los cuestionarios lograron mantenerse relevantes y parecía una de las experiencias más simples y atractivas que podemos brindar en los dispositivos activados por voz.

Otra ventaja del cuestionario era la capacidad que nos daría para volver a empaquetar y distribuir el mismo contenido en otros dominios como televisores inteligentes, sitios web, aplicaciones móviles. El cuestionario también podría usarse para redirigir a los usuarios al contenido relevante de nuestro sitio. Este pensamiento tuvo una gran influencia en la forma en que planeamos nuestro cuestionario de noticias, ya que teníamos que hacer que las interacciones fueran lo suficientemente fluidas para mantener alta la retención de usuarios.

A lo largo de este proceso de planificación, probamos todas las aplicaciones creadas por organizaciones de noticias para Google Home y Amazon Alexa. Nuestra conclusión fue que, al principio, casi ninguna de las aplicaciones hizo que mis empresas de medios parecieran comprender el nuevo tipo de interacciones necesarias para la asistido por voz plataformas. Entraremos en detalle nuestro análisis en otro artículo.

Para el MVP, decidimos ir con un número fijo de preguntas. El número de preguntas de las pruebas realizadas para asistido por voz Las plataformas iban de 4 a 10. Sin embargo, la voz es única en términos de la atención del usuario y decidimos ser breve y decidimos mantener el número de pregunta en 3.

Dado que nuestro objetivo era hacer de esta aplicación un cuestionario de noticias semanal, teníamos que asegurarnos de que la arquitectura admitiera las actualizaciones semanales del producto. La otra consideración de diseño que tuvimos fue el soporte para vincular cada pregunta a una noticia.

Para sacar rápidamente un prototipo, usamos API.ai o también conocido como Dialogflow. El sistema nos permitió asignar ciertas palabras a ciertas acciones, pero había un problema. Queríamos que el cuestionario progresara a medida que el usuario respondía. Así que tuvimos que llamar a un webhook cada vez que el usuario iniciaba el cuestionario y respondía lo que el usuario enviaba al servidor. La interfaz API.AI proporcionada nos ayudó a hacer coincidir lo que dijo el usuario con la acción correspondiente en el webhook.

1. Informe de tendencias de chatbot 2021

2. 4 HACER y 3 NO HACER para entrenar un modelo de PNL Chatbot

3. Bot Concierge: Maneja múltiples chatbots desde una pantalla de chat

4. Un sistema experto: IA conversacional Vs Chatbots

El desafío inicial

Mientras construíamos el prototipo, encontramos un problema con las respuestas. Como las preguntas iban a cambiar cada semana y las respuestas podían ser de cualquier forma, rápidamente nos dimos cuenta de que sería muy difícil que el usuario pronuncie todas las respuestas. Hubo casos en los que no pudimos pronunciar nuestras propias respuestas correctamente o en los que pronunciamos correctamente, el Asistente de Google no entendería y arrojaría un error.

La solución que se nos ocurrió para este problema fue que el usuario dijera el número de la respuesta en lugar del texto. Sin embargo, nos aseguramos de que si el usuario dice tanto el número como la respuesta en sí, lo contestaríamos.

Antes de lanzar el producto, compilamos una lista de oradores con varios acentos para comprender si nuestro enfoque numérico es ideal. Un problema inmediato que notamos fue la incorporación del usuario. Sin una integración adecuada, la mayoría de los usuarios no dijeron el número de la respuesta y se confundieron. Además, algunas personas tenían problemas para decir dos y tres. Así que asignamos "hacer" a dos y "árbol" a tres. Afortunadamente, el Asistente de Google nos permitió ver cada palabra que dijo el usuario para invocar una acción. Esto nos mostró dónde los usuarios tenían más problemas. Por ejemplo, nos dimos cuenta de que algunos usuarios estaban pidiendo que se repitiera la pregunta o simplemente pidiendo ayuda en general. Al ver esto, implementamos rápidamente estas funciones.

Un video de las primeras versiones del TRT World Quiz. Disculpas por el escritorio desordenado.

Aunque fuimos uno de los primeros en llegar al espacio del asistente de voz en nuestra industria, nuestra aplicación carecía de un ingrediente especial que hiciera que los usuarios hablaran con sus amigos al respecto. Una cosa que la mayoría de las aplicaciones no pudieron hacer fue cambiar la voz predeterminada del dispositivo y hacerlo sentir más humano. Algunos incluso argumentaron que el TTS es mejor ya que las expectativas de los usuarios se reducen debido a la voz robótica. Decidimos cambiar eso por completo y hacer que la aplicación sea completamente narrada por humanos.

Otra cosa fundamental que implementamos para ayudar a que el juego se sintiera más divertido fueron las respuestas personalizadas a las respuestas correctas o incorrectas a una pregunta. Escribimos e hicimos la voz en off para más de 40 respuestas. La respuesta vendría aleatoriamente del grupo. Estas respuestas tomaron por sorpresa a casi todos los usuarios que lo probaron. Si se equivocó en la pregunta, nuestra aplicación diría felicitaciones en un tono jovial solo para ser seguida por la respuesta incorrecta. De hecho, uno de los participantes de la prueba de usuario quería volver a realizar el cuestionario para poder escuchar las otras respuestas que teníamos. Este estilo más tarde fue premiado por Google como la mejor persona en aplicaciones en Google Assistant entre miles de solicitantes.

A pesar de nuestra incursión en el cuestionario semanal narrado por humanos, creímos que podíamos hacerlo mejor y aumentamos la frecuencia de semanal a diaria. Esto nos obligó a repensar nuestro enfoque ad-hoc para publicar nuevas preguntas cada semana en Google Home y Alexa. Nos sentamos con el gerente de producto de nuestro CMS para automatizar el proceso, ya que las acciones requieren un formato de archivo específico para los archivos de audio y el texto debe coincidir exactamente con el audio para que esté en el Asistente de Google. Logramos construir una plataforma de publicación de cuestionarios dentro de nuestro CMS. Esta plataforma nos permitió publicar el cuestionario con el flujo de trabajo editorial completo integrado y la opción de audio e imagen presentada. El cuestionario ahora se puede enviar al sitio web, televisores inteligentes, Google Home, Amazon Alexa y las otras plataformas, nuestro cuestionario está presente a través de nuestro CMS.

En el lado del contenido, enfrentamos una reacción violenta del equipo de contenido debido a la falta de recursos de su lado. Producir preguntas y darles voz a diario provocó acaloradas discusiones. En primer lugar, propusieron preparar un lote de preguntas de antemano y hacer la voz en off a diario. Este enfoque funcionó durante un tiempo, pero luego notamos que el cambio en la voz en off todos los días no sonaba bien, ya que la introducción, la salida y las respuestas tenían nuestra voz original entretenida, mientras que las preguntas eran expresadas por otra persona. Cambiamos de táctica y reescribimos todas las preguntas para que se ajustaran a nuestra personalidad y al objetivo de tener un cuestionario de noticias adecuado. Todas las preguntas se habían expresado a la vez para cargarlas a diario.

Coinsmart. Mejor Bitcoin-Börse en Europa
Source: https://chatbotslife.com/how-we-made-an-award-winning-google-assistant-app-f33a0f795d09?source=rss—-a49517e4c30b—4

punto_img

Móvil

Móvil

Información más reciente

punto_img