Logotipo de Zephyrnet

El código del chatbot Grok-1 se libera

Fecha:

Como prometió, Elon Musk lanzó el modelo detrás del chatbot xAI, Grok-1.

Publicado Bajo la licencia Apache 2.0, los pesos del modelo base y la arquitectura de red ya están disponibles. El modelo tiene 314 mil millones de parámetros y necesita hardware con suficiente memoria GPU para ejecutarlo. Está optimizado para aplicaciones como el diálogo en lenguaje natural y representa el punto de control del modelo base sin procesar de la fase previa a la capacitación, que concluyó en octubre de 2023.

Los críticos han señalado un desempeño relativamente mediocre en los puntos de referencia; Si bien Grok es un modelo grande, tiene un mal desempeño por lo que han visto algunos ingenieros. “Teniendo en cuenta lo pobre que es en comparación con otros modelos, realmente resalta lo importante que es el ajuste fino. Los modelos con recuentos de parámetros MUCHO más pequeños los están superando en muchas métricas”, dijo uno póster en los foros de Hacker News anoche.

Es posible que descubras que cuanto más pequeño Mistral funciona tan bien como Grok-1, por ejemplo.

Para poner su tamaño la perspectiva, incluso con 314 mil millones de parámetros, todavía tiene que ponerse al día con el GPT-4 de OpenAI, que tenía 1.76 billones de parámetros en el último recuento.

En particular, a diferencia de los LLM existentes, que se entrenan con datos con un punto de corte en el tiempo, Grok tiene acceso al corpus de datos en tiempo real de los Xeets de todos a través de X.com, lo que debería permitir realizar algunos experimentos interesantes en los próximos días, aunque como otro El comentarista señaló: "Los datos de los tweets de Twitter en sí mismos son muy idiosincrásicos y breves por diseño, lo que por sí solo no es propicio para la formación de un LLM".

Grok resultará familiar para los usuarios de la plataforma de redes sociales de Musk, X, y los suscriptores han podido hacer preguntas al chatbot y recibir respuestas. Según xAI, Grok se inspiró en La Guía del autoestopista galáctico. "Su objetivo es responder a casi cualquier cosa y, lo que es mucho más difícil, incluso sugerir qué preguntas hacer".

Si un usuario hojea una copia desgastada de Guiones de radio de La guía del autoestopista galáctico, se puede encontrar la siguiente definición en Fit the Tenth: “La Guía del autoestopista galáctico es un compañero indispensable para todos aquellos que desean encontrarle sentido a la vida en un universo infinitamente complejo y confuso, porque aunque no puede esperar ser útil o informativo sobre todos los asuntos, hace la afirmación tranquilizadora de que cuando es inexacto, al menos es definitivamente inexacta.

"En caso de discrepancia importante, siempre es la realidad la que se equivoca".

El lanzamiento se produce en el primer aniversario del lanzamiento del modelo GPT-4 de OpenAI, y la disputa legal de Musk con sus antiguos amigos de IA permanece en un segundo plano. A principios de este mes, Musk demandó a OpenAI, alegando que había poca información abierta sobre la empresa, a pesar de su nombre. AbiertoAI respondió al publicar una gran cantidad de correos electrónicos, afirmando que Musk estaba plenamente consciente de sus planes y quería que se incorporara a Tesla.

Patrik Backman, socio general de OpenOcean, dijo sobre el lanzamiento de Grok-1: “Por una vez, Elon Musk está poniendo sus principios en acción. Si demanda a OpenAI por transformarse en una organización con fines de lucro, debe estar preparado para adherirse a los mismos ideales”.

¿ no tiene publicado por xAI también es digno de mención. Las pesas Grok-1 existen, pero los datos utilizados para el entrenamiento no están disponibles bajo la misma licencia, lo que llevó al experto en inteligencia artificial Gary Marcus a bromear: "Parcialmente OpenAI".

Las herramientas de IA generativa de código abierto han resultado controvertidas. A algunos desarrolladores les preocupa que hacer que la tecnología esté disponible suponga un riesgo de abuso y otros señalan los beneficios inherentes de la transparencia.

Meta compartidotipo de – sus modelos Llama 2 el año pasado, y otras empresas han seguido su ejemplo. OpenAI, por otro lado, definitivamente no.

Al abrir los pesos detrás de Grok-1, Musk está intentando plantar una bandera en el campo opuesto al mundo propietario de OpenAI.

En cuanto a su rendimiento final, como todo lo que toca Musk, podría ir en cualquier dirección. ®

punto_img

Información más reciente

punto_img