Logotipo de Zephyrnet

Transformar la investigación cualitativa mediante la automatización del análisis de voz a texto a texto

Fecha:

Los autores de esta publicación son Satish Jha, gerente de automatización inteligente, Matt Docherty, gerente de ciencia de datos, Jayesh Muley, consultor asociado y Tapan Vora, creación rápida de prototipos, de ZS Associates.

En ZS Associates, hacemos una cantidad significativa de investigación de mercado cualitativa. El trabajo implica entrevistar a sujetos relevantes (como profesionales de la salud y representantes de ventas) y desarrollar análisis personalizados sobre los datos de la entrevista. Aprovechamos los avances en inteligencia artificial, aprendizaje automático (ML) y computación en la nube para reinventar la investigación de mercado cualitativa y desarrollamos una solución escalable que está equipada para realizar conversión de voz a texto y procesamiento de lenguaje natural (NLP) en el grabaciones de audio de los sujetos entrevistados. La solución es mejor, más económica y más rápida que las formas actuales de trabajo (interpretación manual), lo que brinda una ventaja competitiva en este espacio.

Esta publicación analiza cómo ZS usó Amazon Transcribe, Amazon Comprende Médicoy NLP personalizado para resúmenes de texto y visualización de gráficos para crear una solución escalable y automatizada que nos ayude a proporcionar información de una manera más rápida, mejor y más eficiente.

Evaluación de antecedentes

El método tradicional de realizar una investigación de mercado cualitativa requiere la intervención e interpretación humana, que es de naturaleza altamente subjetiva. Usamos IA y ML avanzados para desarrollar una plataforma que es capaz de lo siguiente:

  • Realización de conversión de voz a texto; específicamente con alta precisión, convertir grabaciones de audio de entrevistas realizadas con fines de investigación de mercado cualitativa
  • Obtener información analítica del texto convertido utilizando un modelo NLP de última generación

Para lograr esto, combinamos los servicios de IA de AWS de última generación y las capacidades de computación en la nube con nuestros algoritmos de resumen de texto y NLP patentados para impulsar el impacto a escala.

Resumen de la solución

Para construir nuestra solución, adoptamos la metodología de comenzar poco a poco, resaltar el valor y escalar rápidamente. Identificamos un grupo de usuarios clave y definimos la fase uno de la solución para realizar análisis y conversión de voz a texto automatizados. Definimos una interfaz de usuario clave y desarrollamos la arquitectura tecnológica para la solución. Debido a que ZS es un socio de AWS y ya ha estado utilizando varios servicios en la nube de AWS para nuestros productos y soluciones empresariales, AWS fue la opción preferida para este proyecto. Utilizamos Amazon Transcribe y Amazon Comprehend Medical para fines de transcripción e identificación de temas. Para alojar API de análisis NLP personalizadas, usamos una infraestructura sin servidor usando Puerta de enlace API de Amazon, AWS Lambday Servicio de contenedor elástico de Amazon (Amazon ECS) con AWS Fargate. Estos servicios son elegibles para HIPAA y cumplen con los requisitos normativos farmacéuticos.

El proceso incluye las siguientes etapas:

  • Subida de archivos a Amazon S3 – El proceso comienza cuando el usuario carga uno o más archivos de grabación de audio para su transcripción en el sitio en el que está alojada nuestra herramienta. Para subir los archivos a Servicio de almacenamiento simple de Amazon (Amazon S3), el usuario recibe un token escrito temporal o una URL prefirmada mediante API Gateway, que proporciona acceso a Amazon S3.
  • Transcripción de audio – Dependiendo del tipo de archivo cargado, existen diferentes disparadores para iniciar el flujo de trabajo apropiado:
    • Archivos de audio cargados sin un archivo de diccionario – Si el usuario no proporcionó un archivo de diccionario, la herramienta procesa el archivo de audio mediante Amazon Transcribe.
    • Archivos de audio cargados con un archivo de diccionario – Si el usuario proporcionó un archivo de diccionario, ciertos Funciones de paso de AWS Se activan los pasos, seguidos del procesamiento del archivo de diccionario con Amazon Transcribe. Cuando se completa el procesamiento del diccionario, la herramienta transcribe el archivo de audio mediante Amazon Transcribe.
  • Generación de archivos de transcripción – En cualquiera de los dos casos anteriores, cuando la transcripción está en curso, la herramienta utiliza Eventos de Amazon CloudWatch para actualizar el estado de la transcripción. Las funciones de Lambda activan la herramienta para actualizar el estado en el RDBMS y transmitir el estado al usuario a través de la interfaz de usuario de la herramienta mediante sockets. Cuando se completa la transcripción, el archivo de salida final se almacena en Amazon S3.
  • Conversión de tipo de archivo – Después de que se genera el archivo de salida, la herramienta usa activadores para crear un archivo .doc o .xlsx, almacenado nuevamente en Amazon S3.
  • Generando insights analíticos – Con Amazon Comprehend Medical y ciertas herramientas de NLP internas de ZS, la herramienta genera análisis basados ​​en los datos transcritos y actualiza los paneles en nuestro sitio para acceder a ellos en tiempo real.
  • Transmisión de audio con Amazon Transcribe - Usamos Amazon CloudFront transmisión de audio emparejada con nuestro archivo de salida final, que se genera desde Amazon Transcribe. El usuario puede escuchar la grabación y leer la transcripción simultáneamente.

El siguiente diagrama muestra la arquitectura y el flujo de trabajo de alto nivel.

La plataforma está diseñada para procesar una gran cantidad de archivos en tiempo real. Por lo tanto, la solución aumenta en gran medida el trabajo de nuestro actual equipo de investigación cualitativa de ZS al hacer que el proceso sea más eficiente y darle una dimensión completamente nueva.

En general, nuestra solución tiene las siguientes características:

  • La capacidad de cargar uno o varios archivos de audio
  • Conversión automática de voz a texto, con la capacidad de agregar un diccionario personalizado
  • La capacidad de escuchar el audio cargado y refinar el texto
  • Resumen y análisis de texto

Mapa de proceso

El siguiente diagrama ofrece una visualización de alto nivel de nuestra solución desarrollada, con las siguientes etapas:

  • Subir audio – El proceso comienza cuando el usuario carga su grabación de audio (con o sin un archivo de diccionario) a la herramienta
  • Dictado a texto – Estos archivos de audio cargados se transcriben convirtiendo voz a texto
  • Escucha y refina – El usuario puede escuchar simultáneamente la grabación y leer la transcripción y hacer cambios cuando sea necesario
  • Salida de voz a texto – El archivo consolidado incluye la transcripción convertida y sus correspondientes analíticas

Nos llevó aproximadamente de 5 a 6 meses desarrollar esta solución de principio a fin con cuatro
equipo de miembros r. Hoy en día, más de 300 personas la utilizan y la herramienta ha procesado miles de horas de audio.

Servicios de AWS utilizados

La solución utiliza múltiples servicios de AWs:

  • AWS Lambda y API Gateway – Alojó las API y funciones sin servidor.
    • Desarrollamos múltiples puertas de enlace API para garantizar un acoplamiento flexible y una fácil integración con API externas. Se implementaron autorizadores personalizados para habilitar la autenticación basada en tokens y restringir el acceso no autorizado al contenido web.
    • También creamos las API de Lambda (usando Python y NodeJS) que podrían interactuar fácilmente con un sitio web alojado en contenedores ECS y también se pueden vincular fácilmente con Servicio de base de datos relacional de Amazon (Amazon RDS) para PostgreSQL. El uso de funciones de Lambda en nuestra solución nos ayudó a evitar los esfuerzos de balanceo de carga, restauración y detención de clústeres y a reducir los costos generales, ya que los clústeres solo se ejecutaban cuando las funciones se estaban ejecutando. Además, pudimos escalar fácilmente nuestra solución gracias a la arquitectura sin servidor.
  • Amazon Transcribe – Nos proporcionó opciones para configurar fácilmente el procesamiento por lotes de archivos de audio hasta 100 a la vez e incluso escalar una carga mayor utilizando su mecanismo de cola incorporado. También nos permitió cargar un diccionario personalizado para transcribir los datos de audio con mayor precisión.
  • Amazon Comprende Médico – Perspectivas analíticas generadas a partir de los datos de texto utilizando sus capacidades NLP integradas para clasificar el texto en busca de información valiosa.
  • Formación en la nube de AWS - Nosotros usamos Formación en la nube de AWS para implementar las funciones y las API de Lambda en todos los entornos (varios depósitos de S3 y varios entornos en el mismo depósito, como producción y desarrollo) utilizando variables de etapa.
  • AWS CodeBuild, AWS CodeDeploy y AWS CodePipeline - Nosotros usamos Construcción de código AWS, Implementación de código de AWSy AWS CodePipeline para realizar una implementación continua del front-end y el backend de análisis en los clústeres de ECS.

El siguiente diagrama ilustra la arquitectura de estos servicios.

Conclusión

Usamos los servicios de AWS para desarrollar una plataforma que ayudó a nuestros equipos a aplicar IA de vanguardia a sus proyectos. Ha ayudado a nuestros equipos a hacer lo siguiente:

  • Automatice el proceso de conversión de voz a texto y céntrese únicamente en los aspectos de baja precisión.
  • Impulse la automatización de los conocimientos con algoritmos de NLP.
  • Conduzca el autoservicio. Debido a que no necesitamos lanzar ningún servidor en particular, podemos crear fácilmente funciones Lambda, realizar cambios en el código sobre la marcha y proporcionar servicios de ML clave como plug and play para que los usuarios no necesiten ser científicos de datos.

En la actualidad, más de 300 personas utilizan la solución y hemos procesado miles de horas de audio. Ahora estamos integrando nuestra solución con otras aplicaciones para brindarles a los usuarios la flexibilidad de cargar archivos de audio para transcribirlos o cargar directamente archivos transcritos para obtener información analítica.

También obtuvimos múltiples beneficios al construir nuestra plataforma con AWS:

  • El uso de una arquitectura basada en la nube de extremo a extremo demostró ser beneficioso en términos de gestión de entornos para aplicaciones comerciales.
  • Con herramientas de administración como CloudWatch, AWS CloudFormation, CodeBuild, CodeDeploy y CodePipeline, fue más fácil monitorear, rastrear e implementar cambios de desarrollo.
  • Usamos la seguridad integrada de AWS con nubes privadas virtuales y administración de identidades con políticas personalizadas
  • Pudimos reducir la carga en valiosos microservicios, con el beneficio adicional de un alojamiento e implementación rápidos

Sobre ZS

ZS Associates es una firma de consultoría y servicios profesionales que se enfoca en consultoría, software y tecnología, con sede en Evanston, Illinois, que brinda servicios para clientes en las áreas farmacéutica, de salud y tecnología. La firma emplea a más de 10,000 empleados en 30 oficinas en América del Norte, América del Sur, Europa y Asia. ZS trabaja con 49 de los 50 mayores fabricantes de medicamentos y 17 de los 20 mayores fabricantes de dispositivos médicos y atiende a las industrias de productos de consumo, servicios financieros, productos industriales, telecomunicaciones, transporte y logística.

Observación: AWS no es responsable del contenido o la precisión de esta publicación. El contenido y las opiniones de esta publicación son únicamente del autor externo. Es responsabilidad de cada cliente determinar si están sujetos a HIPAA y, de ser así, cuál es la mejor manera de cumplir con HIPAA y sus reglamentos de implementación. Antes de utilizar AWS en relación con la información de salud protegida, los clientes deben ingresar un Anexo para socios comerciales (BAA) de AWS y seguir sus requisitos de configuración.


Acerca de los autores

Satish Jha es gerente de ZS Associates. Es líder en la Práctica de Automatización Inteligente de la firma, donde trabaja codo a codo con varios clientes farmacéuticos para transformar las operaciones e impulsar el impacto.

matt docherty es gerente de ciencia de datos en ZS Associates en la oficina de Filadelfia. Está enfocado en aplicar la ciencia de datos en la industria farmacéutica.

jayesh muley es Consultor Asociado para Excelencia y Transformación de Procesos con ZS Associates. Tiene 4 años de experiencia asesorando a clientes farmacéuticos en los espacios de pronóstico, excelencia de procesos y transformación digital. Desempeñó un papel fundamental en el establecimiento del centro de excelencia de automatización de ZS. Siempre está interesado en aprender nuevas tecnologías y siempre está evolucionando en su rol.

Tapan Vorá es gerente de creación rápida de prototipos con ZS Associates. Tapan tiene más de 14 años de experiencia en gestión de tecnología e ingeniería. Desempeña múltiples roles en el equipo, como analista comercial, gerente de personas, diseñador de soluciones, analista de datos y líder de productos.

punto_img

Información más reciente

punto_img