Logotipo de Zephyrnet

Mejore la precisión del procesamiento de facturas con Nanonets y ChatGPT

Fecha:

No estaría exagerando si dijera que una persona promedio envía/recibe al menos 10 facturas por semana. Con la creciente digitalización, las empresas se enfrentan a grandes volúmenes de facturas todos los días. Tradicionalmente, el procesamiento de facturas ha sido un proceso manual y lento, que necesita recursos significativos y es propenso a errores.

Con la llegada de la IA y el procesamiento del lenguaje natural, el procesamiento de facturas ahora se puede automatizar y simplificar, lo que lleva a una mayor eficiencia y precisión. GPT significa "Transformador generativo preentrenado" y se refiere a una familia de poderosos modelos de procesamiento de lenguaje desarrollados por OpenAI. Los modelos GPT se entrenan previamente en grandes cantidades de datos de texto y luego se pueden ajustar para tareas específicas, incluido el procesamiento de facturas.

Tomemos el caso del procesamiento de facturas para los pedidos de una librería, una factura de muestra se muestra en la imagen a continuación. Esta factura tiene la información sobre el envío, la facturación, los artículos y los precios. ¡Imagínese tener que recopilar datos manualmente de miles de facturas! Afortunadamente, contamos con herramientas de inteligencia artificial que aceleran el proceso.

En este blog, lo guiaré a través de los pasos para procesar su factura usando GPT-4 y Nanonets. ¡Toma una taza de café y prepárate!

Paso 1: cree una cuenta de Nanonets y cargue la imagen

El primer paso es extraer los datos de texto de la imagen de nuestra factura. Las técnicas de OCR (reconocimiento óptico de caracteres) utilizan algoritmos de reconocimiento de patrones para identificar y convertir caracteres en texto en imágenes o documentos escaneados. La plataforma de inteligencia artificial (IA) basada en la nube Nanonets ofrece herramientas de OCR seleccionadas para tareas específicas, incluido el OCR de facturas. Simplemente puede registrarse esta página y acceda a su herramienta Factura OCR de forma gratuita.

Una vez que inicie sesión y haga clic en Factura OCR, puede encontrar una opción "Cargar archivos". Nanonets es muy fácil de usar y le permite cargar archivos desde más de 6 aplicaciones.

Subí la factura de muestra de Agatha Book Store aquí. La extracción se completaría en unos minutos y obtendría los resultados descartados como se muestra. Aquí, se utiliza un modelo de aprendizaje profundo preentrenado para extraer las entidades y sus valores.

Todos los campos de texto identificados por Nanonets están delimitados por cuadros separados. Los valores extraídos para estos campos se pueden ver en la pestaña 'RESULTADOS FINALES' a la derecha. Esta extracción de entidades realizada por Nanonets se puede mejorar utilizando GPT-4. Nanonets también brinda opciones para agregar o modificar los nombres de los campos, lo que mejora la personalización y la experiencia del usuario para los clientes.


¿Busca automatizar sus procesos AP manuales? Reserve una demostración en vivo de 30 minutos para ver cómo Nanonets puede ayudar a su equipo a implementar de principio a fin Automatización AP.

Paso 2: Descargar datos de texto OCR

Los datos de texto OCR extraídos se pueden descargar en múltiples formas. Consulte el siguiente GIF para ver la demostración de cómo descargar los datos de la factura en un archivo Excel o CSV. En el archivo CSV, todos los nombres de los campos de entidad/datos se almacenan como columnas y sus valores están en las filas correspondientes.

Copiamos y pegamos los datos del CSV descargado y obtenemos el texto generado por OCR. Aquí está el texto que descargué de nuestra factura de muestra en Nanonets.

El texto generado por OCR se puede mejorar usando Chat GPT3 con los siguientes pasos.

La extracción de entidades se puede ampliar para admitir diferentes consultas si usamos modelos GPT4 además del texto procesado de Nanonets. Puede registrarse para obtener una cuenta Open AI desde esta página y obtenga acceso a los modelos de lenguaje grande. Una vez que configure su cuenta, recibirá una clave API única. Es por medidas de seguridad, para autenticar y autorizar las solicitudes realizadas a los servidores de OpenAI. Importe el paquete OpenAI y establezca el valor de la clave API.

Diseñar un mensaje de manera clara y estructurada es el secreto para desbloquear el poder de los grandes modelos de lenguaje. Para extraer campos de datos o entidades y sus valores, podemos usar el siguiente mensaje.

#define tu aviso

prompt_text= Este es el texto generado por OCR de las facturas de los pedidos de la librería” +ocr_generated_text” + “Extraer las entidades y sus valores como un par clave-valor del texto OCR proporcionado y la salida en el formato de clave: valor”

Una vez que tenga un aviso, puede pasarlo a cualquier modelo pre-entrenado de OpenAI y obtener una respuesta a través del “ función openai.Completion.create()”. Hay algunos parámetros que puede elegir para obtener el mejor resultado.

Parámetros de GPT:

  • motor Este parámetro le permite elegir un modelo de lenguaje grande (LLM) preentrenado específico para usar para generar el texto. Se puede configurar en un modelo preentrenado o en un modelo personalizado ajustado. Text Davinci es una opción poderosa y eficiente.
  • Rápido:  Es el indicador de texto inicial que se le da al modelo para comenzar a generar el texto. En nuestro caso, la variable “prompt_text” que definimos anteriormente.
  • Max_tokens:  Indica el número máximo de tokens que el modelo puede generar para una solicitud determinada. Puede controlar la longitud del texto generado a través de esto.
  • Temperatura: Úselo para controlar el grado de aleatoriedad o creatividad en el texto generado. Un valor de temperatura baja produce una salida más conservadora y predecible, mientras que un valor de temperatura alta genera una salida más creativa y variada. El valor de la temperatura varía de 0 a 1, siendo 1 el más creativo.

Ahora que está familiarizado con los parámetros de GPT, escribamos el código para generar una salida pasando el texto de solicitud junto con otros parámetros.

Obtuvimos la salida como:

¡Las entidades y sus valores se han extraído rápidamente en solo unos pocos pasos!

Paso 4: Mejorar las correcciones de datos

Entre las miles de facturas que circulan en cualquier negocio, las inconsistencias y los errores menores en los datos de los clientes son inevitables. Por ejemplo, algunos clientes pueden haber proporcionado un formato de correo electrónico o números de contacto no válidos o la fecha puede estar en diferentes formatos. Con Nanonets y GPT-4, puede identificar fácilmente estos problemas y realizar correcciones de datos. Podemos implementar validaciones basadas en reglas, para verificar la corrección y el formato y también verificar las inconsistencias.

Le doy un mensaje a GPT para que realice la validación de la fecha y el correo electrónico para nosotros.

prompt_text= “En los datos de las entidades extraídas anteriormente, valide si el formato de fecha (DD/MM/AAAA) y el correo electrónico son correctos?”

El LLM proporciona un código de Python que usa expresiones regulares para verificar el formato, como se muestra en la imagen a continuación. En una expresión regular, buscamos un patrón particular y lo emparejamos. Las entidades extraídas se almacenan en un diccionario y las funciones se definen por separado para validar el correo electrónico y las fechas de la factura.

Después de definir, se puede pasar cualquier fecha como ('Fecha de la factura'), ID de correo electrónico del vendedor o del comprador a estas funciones para obtener el resultado.

GPT también lo ayuda a realizar correcciones y cambios en los datos de una manera rápida y conveniente. Tenga en cuenta que en nuestra factura, la fecha es '02/05/2023'. Doy el mensaje a continuación para convertir la fecha al formato de "MM/DD/YY".

prompt=” cambia el formato de los datos en las entidades extraídas a 'MM/DD/AA'. Mantenga solo los últimos 2 dígitos del año”

En la salida, los datos se han corregido como se desea. Podemos dar indicaciones similares para verificar si el número de contacto tiene 10 dígitos, si la dirección está en el formato deseado y también verificar si faltan valores de datos.


Configure flujos de trabajo AP sin contacto y optimizar el proceso de cuentas por pagar en segundos. Reserve una demostración en vivo de 30 minutos ahora.

Paso 5: compruebe si hay problemas de datos

Cualquier incoherencia en los datos se puede identificar fácilmente con GPT-4. En nuestro ejemplo, puede verificar si el monto total adeudado no coincide con la suma de los precios de los artículos individuales. Proporcionemos un aviso para ello.

prompt = "Verifique si el saldo total adeudado en la factura es consistente con la cantidad y los precios de los artículos en la factura"

GPT-4 genera una función en Python que calcula la suma de los precios de todos los pedidos, multiplicando la cantidad y el precio del artículo individual. En caso de que el saldo total no coincida con el monto escrito en la factura, se marca e investiga la factura en particular. Esto podría ayudar a las empresas a evitar errores, discrepancias y validar sus datos financieros.

Si tiene un gran conjunto de datos de facturas, también puede comprobar la coherencia entre varias facturas. Por ejemplo, puede comparar la información del vendedor y del comprador en varias facturas para identificar discrepancias o anomalías.

Paso 6: consulta con GPT

Una vez que haya extraído las entidades, GPT también se puede usar para obtener respuestas a consultas específicas de toda la información. Por ejemplo, ¿qué sucede si desea conocer la información sobre los detalles de envío de un número de factura en particular?

Hagamos un aviso para ello:

#define tu aviso

prompt_text= "Extraer los detalles sobre el envío de los pares clave-valor de la Entidad"

La finalización generada para este aviso fue:

>> ¡Claro! Según los datos de OCR proporcionados, podemos extraer la información de envío y la información de facturación en dos grupos de la siguiente manera:

Información de envío:

“número_factura”: “3522”

ship_to_name: Gayathri Natarajan

dirección_de_envío: 600053 No.22B, Chetpet, Chennai, Tamil Nadu, India: Tanaya Pakahale

También se puede realizar una consulta similar para obtener los detalles del vendedor. Aquí está la información extraída sobre los vendedores de los datos proporcionados:

  • nombre_del_vendedor: AGATHA BOOK HOUSE
  • dirección_del_vendedor: No.13 , 2nd Avenue , Indiranagar, Bangalore , Karnataka , India , 721302
  • vendedor_teléfono: 6783456723

Cuando se trabaja con varios documentos, también podemos buscar y filtrar las facturas con un saldo total adeudado de más de Rs.5000 para analizar los pedidos al por mayor. Dado que GPT tiene la capacidad de retener indicaciones anteriores en la memoria, proporciona la mejor facilidad de uso.


¿Busca automatizar sus procesos AP manuales? Reserve una demostración en vivo de 30 minutos para ver cómo Nanonets puede ayudar a su equipo a implementar de principio a fin Automatización AP.

¿Por qué elegir Nanonets + Chat GPT para el procesamiento de facturas?

  • GPT puede analizar el texto de las facturas e identificar y extraer con precisión las entidades relevantes, incluso cuando están escritas en diferentes formatos o tienen variaciones en la ortografía o la redacción. Esto puede ayudar a reducir los errores y aumentar la precisión.
  • Automatización y ampliar la canalización de datos para las empresas
  • El método más eficiente para procesar grandes volúmenes de facturas. Reduce significativamente el tiempo necesario para la entrada y el procesamiento de datos.
  • Las herramientas ofrecen flexibilidad y adaptabilidad. Estas herramientas pueden ser fácilmente integrado en los sistemas existentes y se puede personalizar para adaptarse a las necesidades comerciales específicas
  • Una de las ventajas de la solución OCR de facturas de Nanonets es su capacidad para aprender de sus errores. El sistema utiliza el aprendizaje automático para mejorar su precisión con el tiempo, haciéndolo más preciso con cada nueva factura procesada. La plataforma también permite a los usuarios revisar y corregir cualquier error manualmente, asegurando que los datos extraídos sean precisos y confiables.

Si bien hay muchas ventajas, también debemos comprender las limitaciones de este método. La precisión es pobre en situaciones donde la calidad de la imagen/PDF es baja. Las herramientas basadas en inteligencia artificial también están sujetas a sesgos o errores que son inherentes a los datos de entrenamiento.

En general, aprovechar GPT para la extracción de entidades en el procesamiento de facturas puede ayudar a las empresas a optimizar sus operaciones, reducir el trabajo manual y mejorar la precisión, lo que lleva a una mejor gestión financiera y toma de decisiones.


Configure flujos de trabajo AP sin contacto y optimizar el proceso de cuentas por pagar en segundos. Reserve una demostración en vivo de 30 minutos ahora.

punto_img

Información más reciente

punto_img