Google se adelanta con su nueva IA de vídeo

DeepMind, renombrada por sus innovaciones como AlphaGo y AlphaFold, ha lanzado su más reciente modelo de generación de vídeo por IA: Veo 2. Este lanzamiento llega en el momento justo, especialmente considerando que Sora, el generador de vídeos por IA de OpenAI, aún tiene camino por recorrer.

Un avance notable en especificaciones. Veo 2 es capaz de generar clips de vídeo de hasta dos minutos con resoluciones que alcanzan el 4K DCI (4.096 x 2.160). Esto representa el cuádruple de la resolución y séxtuple en duración en comparación con Sora, que hasta ahora lideraba en este campo.

Acceso limitado por ahora. Veo 2 se encuentra disponible exclusivamente a través de Vertex AI en VideoFX, la herramienta experimental de Google para la creación de vídeos. Actualmente, esta herramienta está accesible mediante lista de espera y los vídeos están limitados a una duración de ocho segundos con resolución 720p. En contraste, Sora genera vídeos de 1080p de hasta 20 segundos.

De texto e imagen a vídeo. Veo 2 tiene la capacidad de crear vídeo a partir de un texto prompt y también puede tomar una imagen de referencia junto con un texto para partir de ella. No obstante, esto no es lo más destacable.

Comprensión avanzada de la física. Según DeepMind, Veo 2 posee una mejor «comprensión» de la física y del control de cámara, lo cual permite generar fragmentos de vídeo más claros. Las texturas e imágenes son más definidas, especialmente en escenas con mucho movimiento. También se puede controlar mejor el enfoque de cámara para capturar objetos y personas desde distintos ángulos.

Resultados prometedores. La mejor comprensión de la física es notable en la generación de vídeos que incluyen fluidos o donde la luz y las sombras juegan un papel crucial. Los vídeos de demostración presentados por Google muestran resultados muy prometedores.

El reto de la coherencia. Aunque hay margen para mejorar, especialmente en términos de coherencia y consistencia, Veo 2 ya demuestra ser superior a Sora en muchos aspectos. La consistencia de los personajes es un área a mejorar, aunque los resultados actuales son impresionantes.

Sora pierde terreno. Aunque OpenAI ha sido un líder en este campo gracias a Sora, los nuevos vídeos muestran que DeepMind ha superado claramente a su competencia. Los resultados compartidos en plataformas como YouTube o X demuestran la superioridad de Veo 2.

El valor añadido de YouTube. Entrenar modelos es un proceso complejo, pero Google y DeepMind cuentan con la ventaja de tener acceso a YouTube. Según se ha informado, los modelos Veo han sido entrenados utilizando contenido de YouTube, lo que sin duda contribuye a su potencia.

Imagen | Google DeepMind

Google se adelanta con su nueva IA de vídeo

Noticias de Zacatecoluca

Ultimas noticias

Buscar noticia

Interacciones con los lectores

Deja una respuesta Cancelar la respuesta

Footer

Noticias de Zacatecoluca

Siguenos

Ultimas noticias

Buscar noticia

Tags