Otros Temas

Sora: la nueva herramienta de OpenAI capaz de generar vídeos

Publicado

en

Qué es Sora, cómo funciona, y qué se puede hacer con la inteligencia artificial para generar vídeos de OpenAI

Sora crea vídeos coherentes de varios segundos de duración a partir de descripciones de texto y vuelve a poner el foco en los peligros de la IA como herramienta de desinformación

Dall-E es capaz de crear imágenes indistinguibles de una fotografía. ChatGPT responde como lo haría un ser humano. A OpenAI, la empresa detrás de estas inteligencias artificiales, le faltaba conquistar el vídeo. Ahora también puede presumir de haberlo logrado.

La última herramienta de inteligencia artificial de la compañía es Sora, un modelo capaz de crear secuencias de vídeo de elevada fidelidad a partir de una simple descripción de texto.

«Sora es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo. El modelo entiende no sólo lo que el usuario ha pedido, sino también cómo son las cosas en el mundo real», explican desde OpenAI.

No es el primer motor generativo que trata de conseguir escenas en movimiento pero hasta ahora los resultados de las alternativas dejaban bastante que desear. Aunque herramientas como Dall-E. Midjourney o Imagen son capaces de crear imágenes estáticas muy realistas, es difícil para una inteligencia artificial mantener la coherencia de los diferentes elementos en una secuencia de vídeo.

Los resultados llegan a ser cómicos, carne de memes. A las manos les crecen dedos, la ropa cambia de color e incluso de talla y corte. Un vídeo especialmente gracioso que circula por la red muestra una recreación del actor Will Smith comiendo espagueti en el que la pasta parece tener vida propia.

Sora tiene fallos también pero logra escenas mucho más realistas que la inmensa mayoría y, tal vez más importante, de mayor duración, hasta de un minuto. Los vídeos tienen también una buena resolución, equivalente a 1080p. Algunos de los ejemplos que OpenAI muestra en su web son realmente sorprendentes y si uno no se fija en los detalles, prácticamente indistinguibles de un vídeo real.

El motor consigue también crear escenas convincentes de animación tridimensional o mezclar objetos realistas con otros claramente generados por ordenador.

El realismo de los resultados vuelve a poner el foco en el potencial de estas herramientas en campañas de desinformación. Es relativamente sencillo crear escenas que pueden parecer reales pero que son imaginarias, mucho más de lo que era posible conseguir hasta ahora con avanzadas herramientas de edición de vídeo y audio.

De momento OpenAI no ha abierto la herramienta a cualquier usuario. Sólo un reducido número de académicos, profesionales y un equipo de seguridad encargado de buscar posibles fallos tendrá acceso a Sora en sus primeras versiones.

El modelo tiene además las mismas limitaciones que Dall-E, el motor generativo de imágenes estáticas. No puede generar vídeos de personal reales o con contenido sexual o violento. «Dialogaremos con responsables políticos, educadores y artistas de todo el mundo para comprender sus preocupaciones e identificar casos de uso positivos para esta nueva tecnología», explican desde OpenAI.

Click para comentar
Salir de la versión móvil