Logotipo de Zephyrnet

xAI, liderado por Elon Musk, presenta Grok 1.5V con procesamiento visual

Fecha:


La empresa de inteligencia artificial (IA) de Elon Musk, xAI, está lista para presentar una versión de su modelo de lenguaje Grok que puede procesar imágenes, como compartió la compañía esta semana.

En un comunicado de prensa compartido en su sitio web el viernes, xAI anunció Grok 1.5V, o Grok 1.5 Vision, su primer modelo de IA para procesar video junto con el procesamiento de texto. La noticia significa que Grok ahora puede procesar información visual como documentos, fotografías, diagramas y más, además de hacer que el modelo sea competitivo con otras plataformas multimodales.

"Presentamos Grok-1.5V, nuestro modelo multimodal de primera generación", escribe xAI en el comunicado. “Además de sus sólidas capacidades de texto, Grok ahora puede procesar una amplia variedad de información visual, incluidos documentos, diagramas, cuadros, capturas de pantalla y fotografías. Grok-1.5V estará disponible pronto para nuestros primeros evaluadores y usuarios existentes de Grok”.

Si bien aún no se ha publicado públicamente, xAI dice que Grok 1.5V pronto estará disponible para los primeros evaluadores y para los usuarios existentes de Grok.

La publicación también incluye información detallada de evaluación comparativa que compara Grok 1.5V con competidores multimodales como ChatGPT-4V de OpenAI, Claude 3 Sonnet y Claude 3 Opus de Anthropic, y Gemini Pro 1.5, propiedad de Google. Además, el comunicado comparte siete ejemplos diferentes de cómo Grok 1.5V puede usar información visual, incluido el uso de imágenes del mundo real o la traducción de gráficos a código.

Puede ver el cuadro de evaluación comparativa de Grok 1.5V a continuación, junto con dos de los ejemplos de procesamiento visual.

Crédito: xAI

Crédito: xAI

Crédito: xAI

El modelo multimodal llega después de que Musk dijera a principios de este año que xAI se estaba preparando para lanzar Grok 1.5. En una entrevista realizada a principios de esta semana, Musk también dijo que cree que tendremos una IA que será más inteligente que cualquier ser humano para finales de 2025., mientras que cree que la potencia informática de la IA superará a la de todos los humanos en sólo cinco años.

El mes pasado, xAI oficialmente hizo que los pesos del modelo base y la arquitectura de red de Grok fueran de código abierto, después de las muchas críticas de Musk e incluso una demanda de la antigua organización sin fines de lucro OpenAI por abandonar su misión sin fines de lucro y evitar hacer que sus propios modelos GPT sean de código abierto.

Tras los informes de enero de que afirmó que xAI había estado recaudando capitalMusk negó las acusaciones y agregó que la compañía no tiene planes de recaudar fondos en este momento. Musk debutó con xAI en julio pasado, y la empresa pasó a lanzar Grok como su primer producto en noviembre.

Actualizado a las 5:02 pm MT: Séptimo párrafo editado para mayor claridad.

¿Cuáles son tus pensamientos? Déjamelo saber en zach@teslarati.com, encuéntrame en X en @zacharyvisconti, o envíanos tus consejos a consejos@teslarati.com.

xAI, liderado por Elon Musk, presenta Grok 1.5V con procesamiento visual




<!–

Ver Comentarios

->

punto_img

Información más reciente

punto_img