El botón fácil de IA generativa para ejecutar un POC en su centro de distribución

Oficial La IA generativa se ejecuta a partir de datos, y muchas organizaciones han descubierto que la GenAI es más valiosa cuando la combinan con sus datos únicos y patentados. Pero ahí radica un enigma. ¿Cómo puede una organización aprovechar su tesoro de datos sin poner su negocio en riesgo indebido?

Muchas organizaciones han abordado estas preocupaciones con orientación específica sobre cuándo y cómo utilizar la IA generativa con sus propios datos. Otras organizaciones han prohibido rotundamente su uso por preocupaciones de fuga de propiedad intelectual o exposición de datos confidenciales.

Pero, ¿qué pasaría si le dijera que existe una manera fácil de avanzar detrás de su firewall, ya sea en su centro de datos o en una estación de trabajo? Y la buena noticia es que no requiere ciclos de adquisiciones de meses ni una implementación sustancial para un producto mínimo viable. ¿No convencido? Déjame enseñarte como.

Paso 1: reutilizar el hardware existente para realizar pruebas

Dependiendo de lo que esté haciendo con la IA generativa, las cargas de trabajo se pueden ejecutar en todo tipo de hardware en una fase piloto. ¿Cómo? Efectivamente, existen cuatro etapas de la ciencia de datos con estos modelos. El primero y el segundo, inferencia y generación aumentada de recuperación (RAG), se pueden realizar en configuraciones de hardware relativamente modestas, mientras que los dos últimos, ajuste/reentrenamiento y creación de nuevos modelos, requieren una infraestructura extensa para ver resultados. Además, los modelos pueden ser de varios tamaños y no todo tiene que ser un “modelo de lenguaje grande”. En consecuencia, estamos viendo que muchas organizaciones tienen éxito con “modelos de lenguaje pequeño” específicos de dominio y de empresa que están dirigidos a casos de uso muy limitados. Esto significa que puedes reutilizar un servidor, encontrar una estación de trabajo en la que se pueda implementar un modelo o, si eres muy aventurero, incluso puedes descargar LLaMA 2 en tu computadora portátil y jugar con él. Realmente no es tan difícil soportar este nivel de experimentación.

Paso 2: accede al código abierto

Quizás en ningún otro lugar la comunidad de código abierto esté más a la vanguardia de lo que es posible que en GenAI. Estamos viendo modelos relativamente pequeños que rivalizan con algunos de los despliegues comerciales más grandes del mundo en su aptitud y aplicabilidad. Lo único que le impide comenzar es la velocidad de descarga. Hay una gran cantidad de proyectos de código abierto a tu disposición, así que elige una distribución y ponte en marcha. Una vez descargado e instalado, habrá activado efectivamente la primera fase de GenAI: inferencia. En teoría, tu experimentación podría terminar aquí, pero ¿qué pasaría si con un poco más de trabajo pudieras desbloquear algo de magia real?

Paso 3: Identifique sus casos de uso

Es posible que tengas la tentación de saltarte este paso, pero no lo recomiendo. Identifique un grupo de casos de uso que desee resolver. El siguiente paso es la recopilación de datos y debe asegurarse de obtener los datos correctos para ofrecer los resultados correctos a través del LLM previamente capacitado de código abierto que está aumentando con sus datos. Averigüe quiénes serán sus usuarios piloto y pregúnteles qué es importante para ellos; por ejemplo, un proyecto actual con el que les gustaría recibir ayuda y qué datos existentes tienen que serían útiles para realizar el piloto.

Paso 4: Activar la generación aumentada de recuperación (RAG)

Se podría pensar que agregar datos a un modelo suena extremadamente difícil; es el tipo de cosas que generalmente pensamos que requieren científicos de datos. Pero adivinen qué: cualquier organización con un desarrollador puede activar la generación de recuperación aumentada (RAG). De hecho, en muchos casos de uso, esto puede ser todo lo que necesite hacer para agregar datos a un modelo de IA generativa. ¿Como funciona? Efectivamente RAG toma datos no estructurados como sus documentos, imágenes y videos y ayuda a codificarlos e indexarlos para su uso. Nosotros pilotamos esto nosotros mismos utilizando tecnologías de código abierto como LangChain para crear bases de datos vectoriales que permiten que el modelo GenAI analice datos en menos de una hora. El resultado fue un chatbot totalmente funcional que demostró este concepto en un tiempo récord.

Diagrama GenAI: haga clic para ampliar

Fuente: Tecnologías Dell

En el cierre

Las necesidades y capacidades únicas de GenAI crean una experiencia PoC única y que se puede poner a prueba rápidamente para ofrecer valor inmediato y demostrar su valor a la organización. Poner a prueba esto en su propio entorno ofrece muchas ventajas en términos de seguridad y rentabilidad que no pueden replicarse en la nube pública.

La nube pública es excelente para muchas cosas, pero pagará a cuentagotas por una PoC; es muy fácil gastar un presupuesto con usuarios que no tienen experiencia en ingeniería rápida. La nube pública tampoco ofrece las mismas salvaguardas para los datos confidenciales y de propiedad exclusiva. En realidad, esto puede hacer que los usuarios internos se muevan más lentamente al pensar cada vez que usan una herramienta de IA generativa si los datos que ingresan son datos "seguros" que se pueden usar con ese sistema en particular. Contrariamente a la intuición, esta es una de las pocas ocasiones en que el centro de datos ofrece una agilidad inusualmente alta y un costo inicial más bajo que su contraparte de nube pública.

Así que adelante, tómate una tarde y pon en marcha tu propia PoC, y una vez que estés listo para la siguiente fase, estaremos encantados de ayudarte.

Aquí es donde puedes aprender más sobre Soluciones de IA generativa de Dell.

Ofrecido por Dell Technologies.

Distribución de relaciones públicas y contenido potenciado por SEO. Consiga amplificado hoy.
PlatoData.Network Vertical Generativo Ai. Empodérate. Accede Aquí.
PlatoAiStream. Inteligencia Web3. Conocimiento amplificado. Accede Aquí.
PlatoESG. Carbón, tecnología limpia, Energía, Ambiente, Solar, Gestión de residuos. Accede Aquí.
PlatoSalud. Inteligencia en Biotecnología y Ensayos Clínicos. Accede Aquí.
Fuente: https://go.theregister.com/feed/www.theregister.com/2023/10/09/the_generative_ai_easy_button/

Inteligencia de datos generativa

El botón sencillo de IA generativa para ejecutar un POC en su centro de distribución

Maximizar las ganancias en 2024: una mirada integral a ValueZone.AI

Cobertura en vivo: SpaceX lanzará 23 satélites Starlink en el vuelo Falcon 9 desde Cabo Cañaveral

Información más reciente

Tres claves para que los Islanders ganen el quinto juego

Los Lakers obtienen la codiciada victoria contra Denver, ahora abajo 3-1 en la serie

Falcon 9 lanza satélites de navegación Galileo

El NEVS Emily GT diseñado por ex ingenieros de Saab podría construirse en Italia – Autoblog

Los entusiastas de Dogecoin y Pepecoin se unen detrás del nuevo token de IA lanzado por la plataforma Wahoo Exchange – CryptoInfoNet

Lecciones del ensayo FTX: Regular los CEX puede no ser suficiente para prevenir malos actores | Opinión – CryptoInfoNet