DeepMind, renombrada por sus innovaciones como AlphaGo y AlphaFold, ha lanzado su más reciente modelo de generación de vÃdeo por IA: Veo 2. Este lanzamiento llega en el momento justo, especialmente considerando que Sora, el generador de vÃdeos por IA de OpenAI, aún tiene camino por recorrer.
Un avance notable en especificaciones. Veo 2 es capaz de generar clips de vÃdeo de hasta dos minutos con resoluciones que alcanzan el 4K DCI (4.096 x 2.160). Esto representa el cuádruple de la resolución y séxtuple en duración en comparación con Sora, que hasta ahora lideraba en este campo.
Acceso limitado por ahora. Veo 2 se encuentra disponible exclusivamente a través de Vertex AI en VideoFX, la herramienta experimental de Google para la creación de vÃdeos. Actualmente, esta herramienta está accesible mediante lista de espera y los vÃdeos están limitados a una duración de ocho segundos con resolución 720p. En contraste, Sora genera vÃdeos de 1080p de hasta 20 segundos.
De texto e imagen a vÃdeo. Veo 2 tiene la capacidad de crear vÃdeo a partir de un texto prompt y también puede tomar una imagen de referencia junto con un texto para partir de ella. No obstante, esto no es lo más destacable.
Comprensión avanzada de la fÃsica. Según DeepMind, Veo 2 posee una mejor «comprensión» de la fÃsica y del control de cámara, lo cual permite generar fragmentos de vÃdeo más claros. Las texturas e imágenes son más definidas, especialmente en escenas con mucho movimiento. También se puede controlar mejor el enfoque de cámara para capturar objetos y personas desde distintos ángulos.
Resultados prometedores. La mejor comprensión de la fÃsica es notable en la generación de vÃdeos que incluyen fluidos o donde la luz y las sombras juegan un papel crucial. Los vÃdeos de demostración presentados por Google muestran resultados muy prometedores.
El reto de la coherencia. Aunque hay margen para mejorar, especialmente en términos de coherencia y consistencia, Veo 2 ya demuestra ser superior a Sora en muchos aspectos. La consistencia de los personajes es un área a mejorar, aunque los resultados actuales son impresionantes.
Sora pierde terreno. Aunque OpenAI ha sido un lÃder en este campo gracias a Sora, los nuevos vÃdeos muestran que DeepMind ha superado claramente a su competencia. Los resultados compartidos en plataformas como YouTube o X demuestran la superioridad de Veo 2.
El valor añadido de YouTube. Entrenar modelos es un proceso complejo, pero Google y DeepMind cuentan con la ventaja de tener acceso a YouTube. Según se ha informado, los modelos Veo han sido entrenados utilizando contenido de YouTube, lo que sin duda contribuye a su potencia.
Imagen | Google DeepMind
Deja una respuesta