Introducción
Cohere presentó su modelo básico de próxima generación, Rerank 3 para una búsqueda empresarial eficiente y Recuperación Generación Aumentada(TRAPO). El modelo Rerank es compatible con cualquier tipo de base de datos o índice de búsqueda y también se puede integrar en cualquier aplicación legal con capacidades de búsqueda nativas. No imaginará que una sola línea de código puede aumentar el rendimiento de la búsqueda o reducir la carga de ejecutar un aplicación de trapo con un impacto insignificante en la latencia.
Exploremos cómo se establece este modelo básico para hacer avanzar los sistemas RAG y de búsqueda empresarial, con mayor precisión y eficiencia.
Capacidades de reclasificación
Rerank ofrece las mejores capacidades para la búsqueda empresarial que incluyen lo siguiente:
- Longitud de contexto de 4K que mejora significativamente la calidad de búsqueda de documentos de formato más largo.
- Puede buscar datos semiestructurados y de múltiples aspectos como tablas, códigos, JSON documentos, facturas y correos electrónicos.
- Puede cubrir más de 100 idiomas.
- Latencia mejorada y menor costo total de propiedad (TCO)
Modelos de IA generativa con contextos largos tienen el potencial de ejecutar un RAG. Para mejorar la puntuación de precisión, la latencia y el costo, la solución RAG debe requerir una combinación de generación Modelos AI y por supuesto el modelo Rerank. La reclasificación semántica de alta precisión de rerank3 garantiza que solo se introduzca la información relevante en el modelo de generación, lo que aumenta la precisión de la respuesta y mantiene la latencia y el costo muy bajos, en particular cuando se recupera información de millones de documentos.
Búsqueda empresarial mejorada
Los datos empresariales suelen ser muy complejos y los sistemas actuales que se colocan en la organización encuentran dificultades para buscar en fuentes de datos semiestructurados y de múltiples aspectos. Principalmente, en la organización los datos más útiles no están en el formato de documento simple, como JSON, que es muy común en las aplicaciones empresariales. Rerank 3 puede clasificar fácilmente mensajes complejos y de múltiples aspectos, como correos electrónicos, en función de todos sus campos de metadatos relevantes, incluida su actualidad.
Rerank 3 mejora significativamente la calidad de recuperación del código. Esto puede aumentar la productividad de los ingenieros al ayudarlos a encontrar los fragmentos de código correctos más rápido, ya sea dentro de la base de código de su empresa o en vastos repositorios de documentación.
Los gigantes tecnológicos también se ocupan de fuentes de datos multilingües y, anteriormente, la recuperación multilingüe ha sido el mayor desafío con los métodos basados en palabras clave. Los modelos Rerank 3 ofrecen un sólido rendimiento multilingüe con más de 100 idiomas, lo que simplifica el proceso de recuperación para los clientes que no hablan inglés.
Un desafío clave en la búsqueda semántica y los sistemas RAG es la optimización de la fragmentación de datos. Rerank 3 soluciona esto con una ventana contextual de 4k, lo que permite el procesamiento directo de documentos más grandes. Esto conduce a una mejor consideración del contexto durante la puntuación de relevancia.
Rerank 3 también es compatible con la API de inferencia de Elastic. Elastic Search tiene una tecnología de búsqueda ampliamente adoptada y las capacidades de búsqueda de palabras clave y vectores en la plataforma Elasticsearch están diseñadas para manejar datos empresariales más grandes y complejos de manera eficiente.
"Estamos entusiasmados de asociarnos con Cohere para ayudar a las empresas a desbloquear el potencial de sus datos", dijo Matt Riley, GVP y GM de Elasticsearch. Los modelos de recuperación avanzados de Cohere, Embed 3 y Rerank 3, ofrecen un rendimiento excelente en datos empresariales grandes y complejos. Son su solucionador de problemas y se están convirtiendo en componentes esenciales en cualquier sistema de búsqueda empresarial.
Latencia mejorada con contexto más largo
En muchos ámbitos empresariales, como el comercio electrónico o el servicio de atención al cliente, una baja latencia es crucial para ofrecer una experiencia de calidad. Tuvieron esto en cuenta al crear Rerank 3, que muestra una latencia hasta 2 veces menor en comparación con Rerank 2 para documentos de menor longitud y mejoras de hasta 3 veces en longitudes de contexto largas.
Mejor rendimiento y RAG eficiente
En los sistemas de recuperación de generación aumentada (RAG), la etapa de recuperación de documentos es fundamental para el rendimiento general. Rerank 3 aborda dos factores esenciales para un rendimiento excepcional de RAG: calidad de respuesta y latencia. El modelo destaca por identificar los documentos más relevantes para la consulta de un usuario a través de sus capacidades de reclasificación semántica.
Este proceso de recuperación dirigido mejora directamente la precisión de las respuestas del sistema RAG. Al permitir la recuperación eficiente de información pertinente de grandes conjuntos de datos, Rerank 3 permite a las grandes empresas desbloquear el valor de sus datos patentados. Esto facilita diversas funciones comerciales, incluida la atención al cliente, legal, recursos humanos y finanzas, brindándoles la información más relevante para abordar las consultas de los usuarios.
La integración de Rerank 3 con la rentable familia Command R para sistemas RAG ofrece una reducción significativa en el costo total de propiedad (TCO) para los usuarios. Esto se logra a través de dos factores clave. En primer lugar, Rerank 3 facilita la selección de documentos muy relevantes, lo que requiere que el LLM procese menos documentos para generar una respuesta fundamentada. Esto mantiene la precisión de la respuesta y minimiza la latencia. En segundo lugar, la eficiencia combinada de los modelos Rerank 3 y Command R conduce a reducciones de costos del 80-93 % en comparación con los LLM generativos alternativos del mercado. De hecho, al considerar los ahorros de costos de Rerank 3 y Command R, las reducciones de costos totales pueden superar el 98 %.
Un enfoque cada vez más común y conocido para los sistemas RAG es utilizar LLM como reordenadores para el proceso de recuperación de documentos. Rerank 3 supera a los LLM líderes en la industria como Claude -3 Sonte, GPT Turbo en cuanto a precisión de clasificación y es entre un 90 y un 98 % menos costoso.
El cambio de rango 3 aumenta la precisión y la calidad de la respuesta del LLM. También ayuda a reducir el TCO de un extremo a otro. Rerank logra esto eliminando nuestros documentos menos relevantes y clasificando solo el pequeño subconjunto de los relevantes para obtener respuestas.
Conclusión
Rerank 3 es una herramienta revolucionaria para la búsqueda empresarial y los sistemas RAG. Permite una alta precisión en el manejo de estructuras de datos complejas y múltiples idiomas. Rerank 3 minimiza la fragmentación de datos, lo que reduce la latencia y el costo total de propiedad. Esto da como resultado resultados de búsqueda más rápidos e implementaciones RAG rentables. Se integra con Elasticsearch para mejorar la toma de decisiones y la experiencia del cliente.
Puede explorar muchas más herramientas de inteligencia artificial y sus aplicaciones. esta página.
- Distribución de relaciones públicas y contenido potenciado por SEO. Consiga amplificado hoy.
- PlatoData.Network Vertical Generativo Ai. Empodérate. Accede Aquí.
- PlatoAiStream. Inteligencia Web3. Conocimiento amplificado. Accede Aquí.
- PlatoESG. Carbón, tecnología limpia, Energía, Ambiente, Solar, Gestión de residuos. Accede Aquí.
- PlatoSalud. Inteligencia en Biotecnología y Ensayos Clínicos. Accede Aquí.
- Fuente: https://www.analyticsvidhya.com/blog/2024/04/rerank-3-boosting-enterprise-search-and-rag-systems/