Logotipo de Zephyrnet

Sora AI produce videos sorprendentes al instante

Fecha:

Sora, un nuevo e impresionante modelo de vídeo generativo creado por OpenAI, puede tomar una breve descripción de texto y transformarla en un intrincado clip de película de alta definición de un minuto de duración.

OpenAI, la empresa matriz del chatbot ChatGPT y del generador de imágenes fijas DALL-E, se encuentra entre las muchas empresas que compiten por mejorar este generador de vídeo instantáneo. Otras empresas incluyen empresas emergentes como Runway y gigantes tecnológicos como Google y Meta Platforms Inc., los propietarios de Facebook e Instagram.

La tecnología tiene el potencial de reemplazar por completo a los artistas digitales menos capacitados y, al mismo tiempo, acelerar el trabajo de los cineastas experimentados.

Lea también El cofundador de OpenAI, Andrej Karpathy, dimite y apunta a empresas personales

Liberando a Sora

OpenAI nombró a su nuevo sistema Sora, la palabra japonesa para cielo. El equipo de desarrollo de la tecnología, incluidos los investigadores Tim Brooks y Bill Peebles, eligió el nombre porque "evoca la idea de un potencial creativo ilimitado".

También dijeron que la compañía aún no había hecho público a Sora porque todavía estaba investigando los riesgos asociados con el sistema. Más bien, OpenAI está compartiendo la tecnología con un grupo seleccionado de académicos y otros investigadores externos que la “equiparán”, un término para describir la búsqueda de posibles usos indebidos.

Según el Dr. Brooks, la intención aquí es dar una vista previa de lo que se avecina en el horizonte para que la gente pueda ver las capacidades de esta tecnología y obtener retroalimentación.

OpenAI etiqueta los vídeos

OpenAI ya etiqueta los vídeos creados por el sistema con marcas de agua para indicar que fueron generados por inteligencia artificial (IA). Sin embargo, la empresa reconoce que estos se pueden eliminar. Agregaron que también puede ser difícil identificarlos.

Según la OpenAI, están enseñando inteligencia artificial (IA) para comprender y simular el mundo físico en movimiento, con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieren interacción con el mundo real.

Además, están otorgando acceso a varios artistas visuales, diseñadores y cineastas para obtener comentarios sobre cómo hacer avanzar el modelo para que sea más útil para los profesionales creativos.

Están compartiendo el progreso de su investigación desde el principio para comenzar a trabajar y recibir comentarios de personas ajenas a OpenAI y para brindarle al público una idea de las capacidades de IA que hay en el horizonte.

Desarrollando a Sora

Sin embargo, OpenAI se negó a revelar la cantidad de videos de los que el sistema aprendió o de dónde vinieron. Solo afirmaron que la capacitación incluía tanto videos disponibles públicamente como videos con licencia de los titulares de derechos de autor.

La empresa ha sido demandada varias veces por utilizar contenido protegido por derechos de autor. Probablemente esté intentando mantener una ventaja sobre sus competidores, por lo que no revela nada sobre los datos utilizados para entrenar sus tecnologías.

Además, el modelo tiene una profunda comprensión del lenguaje, lo que le permite interpretar indicaciones con precisión y generar personajes convincentes que transmiten emociones vívidamente. Sora también puede generar varias tomas que mantienen la toma visual y el carácter dentro de un video generado única.

OpenAI compartió el mensaje para generar un video en su identificador X, lo que provocó varias reacciones de los usuarios de X.

Las debilidades del modelo

Según OpenAI, el modelo actual tiene debilidades. Es posible que necesite ayuda para simular con precisión la física de una escena compleja y puede que necesite ayuda para comprender casos específicos de causa y efecto. Por ejemplo, una persona puede morder una galleta, pero después, es posible que la galleta no tenga la marca del mordisco.

Es posible que el modelo también necesite aclarar los detalles espaciales de un mensaje, por ejemplo, mezclando izquierda y derecha, y puede necesitar ayuda con descripciones precisas de eventos que tienen lugar a lo largo del tiempo, como seguir una trayectoria de cámara específica.

punto_img

Información más reciente

punto_img