Logotipo de Zephyrnet

El botón sencillo de IA generativa para ejecutar un POC en su centro de distribución

Fecha:

Oficial La IA generativa se ejecuta a partir de datos, y muchas organizaciones han descubierto que la GenAI es más valiosa cuando la combinan con sus datos únicos y patentados. Pero ahí radica un enigma. ¿Cómo puede una organización aprovechar su tesoro de datos sin poner su negocio en riesgo indebido?

Muchas organizaciones han abordado estas preocupaciones con orientación específica sobre cuándo y cómo utilizar la IA generativa con sus propios datos. Otras organizaciones han prohibido rotundamente su uso por preocupaciones de fuga de propiedad intelectual o exposición de datos confidenciales.

Pero, ¿qué pasaría si le dijera que existe una manera fácil de avanzar detrás de su firewall, ya sea en su centro de datos o en una estación de trabajo? Y la buena noticia es que no requiere ciclos de adquisiciones de meses ni una implementación sustancial para un producto mínimo viable. ¿No convencido? Déjame enseñarte como.

Paso 1: reutilizar el hardware existente para realizar pruebas

Dependiendo de lo que esté haciendo con la IA generativa, las cargas de trabajo se pueden ejecutar en todo tipo de hardware en una fase piloto. ¿Cómo? Efectivamente, existen cuatro etapas de la ciencia de datos con estos modelos. El primero y el segundo, inferencia y generación aumentada de recuperación (RAG), se pueden realizar en configuraciones de hardware relativamente modestas, mientras que los dos últimos, ajuste/reentrenamiento y creación de nuevos modelos, requieren una infraestructura extensa para ver resultados. Además, los modelos pueden ser de varios tamaños y no todo tiene que ser un “modelo de lenguaje grande”. En consecuencia, estamos viendo que muchas organizaciones tienen éxito con “modelos de lenguaje pequeño” específicos de dominio y de empresa que están dirigidos a casos de uso muy limitados. Esto significa que puedes reutilizar un servidor, encontrar una estación de trabajo en la que se pueda implementar un modelo o, si eres muy aventurero, incluso puedes descargar LLaMA 2 en tu computadora portátil y jugar con él. Realmente no es tan difícil soportar este nivel de experimentación.

Paso 2: accede al código abierto

Quizás en ningún otro lugar la comunidad de código abierto esté más a la vanguardia de lo que es posible que en GenAI. Estamos viendo modelos relativamente pequeños que rivalizan con algunos de los despliegues comerciales más grandes del mundo en su aptitud y aplicabilidad. Lo único que le impide comenzar es la velocidad de descarga. Hay una gran cantidad de proyectos de código abierto a tu disposición, así que elige una distribución y ponte en marcha. Una vez descargado e instalado, habrá activado efectivamente la primera fase de GenAI: inferencia. En teoría, tu experimentación podría terminar aquí, pero ¿qué pasaría si con un poco más de trabajo pudieras desbloquear algo de magia real?

Paso 3: Identifique sus casos de uso

Es posible que tengas la tentación de saltarte este paso, pero no lo recomiendo. Identifique un grupo de casos de uso que desee resolver. El siguiente paso es la recopilación de datos y debe asegurarse de obtener los datos correctos para ofrecer los resultados correctos a través del LLM previamente capacitado de código abierto que está aumentando con sus datos. Averigüe quiénes serán sus usuarios piloto y pregúnteles qué es importante para ellos; por ejemplo, un proyecto actual con el que les gustaría recibir ayuda y qué datos existentes tienen que serían útiles para realizar el piloto.

Paso 4: Activar la generación aumentada de recuperación (RAG)

Se podría pensar que agregar datos a un modelo suena extremadamente difícil; es el tipo de cosas que generalmente pensamos que requieren científicos de datos. Pero adivinen qué: cualquier organización con un desarrollador puede activar la generación de recuperación aumentada (RAG). De hecho, en muchos casos de uso, esto puede ser todo lo que necesite hacer para agregar datos a un modelo de IA generativa. ¿Como funciona? Efectivamente RAG toma datos no estructurados como sus documentos, imágenes y videos y ayuda a codificarlos e indexarlos para su uso. Nosotros pilotamos esto nosotros mismos utilizando tecnologías de código abierto como LangChain para crear bases de datos vectoriales que permiten que el modelo GenAI analice datos en menos de una hora. El resultado fue un chatbot totalmente funcional que demostró este concepto en un tiempo récord.

Diagrama GenAI

Diagrama GenAI: haga clic para ampliar

Fuente: Tecnologías Dell

En el cierre

Las necesidades y capacidades únicas de GenAI crean una experiencia PoC única y que se puede poner a prueba rápidamente para ofrecer valor inmediato y demostrar su valor a la organización. Poner a prueba esto en su propio entorno ofrece muchas ventajas en términos de seguridad y rentabilidad que no pueden replicarse en la nube pública.

La nube pública es excelente para muchas cosas, pero pagará a cuentagotas por una PoC; es muy fácil gastar un presupuesto con usuarios que no tienen experiencia en ingeniería rápida. La nube pública tampoco ofrece las mismas salvaguardas para los datos confidenciales y de propiedad exclusiva. En realidad, esto puede hacer que los usuarios internos se muevan más lentamente al pensar cada vez que usan una herramienta de IA generativa si los datos que ingresan son datos "seguros" que se pueden usar con ese sistema en particular. Contrariamente a la intuición, esta es una de las pocas ocasiones en que el centro de datos ofrece una agilidad inusualmente alta y un costo inicial más bajo que su contraparte de nube pública.

Así que adelante, tómate una tarde y pon en marcha tu propia PoC, y una vez que estés listo para la siguiente fase, estaremos encantados de ayudarte.

Aquí es donde puedes aprender más sobre Soluciones de IA generativa de Dell.

Ofrecido por Dell Technologies.

punto_img

Información más reciente

punto_img