Google ha marcado un precedente en el marco del I/O 2025, el evento de software más destacado de la empresa. Este año, el foco se ha centrado en la inteligencia artificial, dejando a Android en un segundo plano.
En el ámbito de la IA, Google ha estado desarrollando un modelo innovador que permite la creación de vÃdeos a partir de texto, llamado Veo. Con su más reciente actualización, Veo 3, esta herramienta ahora incluye la capacidad de generar vÃdeos junto con audio.
Veo 3. El ecosistema de inteligencia artificial generativa de Google se compone de tres niveles: Veo 1, Veo 2 y la novedad de este año, Veo 3. A diferencia de las complejidades a las que estamos acostumbrados, estos nombres reflejan simplicidad. Veo 3 sobresale como el modelo más avanzado, produciendo vÃdeo en 4K con técnicas de compresión cinematográfica. Durante este evento de Google I/O, ha demostrado una habilidad sobresaliente: la integración de audio en los vÃdeos.
Desde sonidos urbanos hasta conversaciones. Con Veo 3, Google apuesta fuerte. Este modelo no solo eleva la calidad respecto a Veo 2, sino que es el primero de Google en generar vÃdeos con audio. Por ejemplo, si la intención es crear una escena urbana, Veo 3 recreará sonidos tÃpicos como pasos, tráfico y el murmullo de la ciudad.
Además, Google ha dado un paso al frente al prometer diálogos entre personajes, superando barreras que parecÃan ciencia ficción y acercando el vÃdeo a texto a un nivel sin precedentes.
Avances en Veo 2. A pesar de que Veo 3 se lleva las luces, Veo 2 también recibe mejoras significativas. Ahora cuenta con controles de cámara más precisos para optimizar movimientos, asà como opciones de edición que permiten cambiar el formato del vÃdeo y manipular elementos dentro de él.
Nace Flow. Complementando a Veo, Imagen y Gemini, Google introduce Flow, una herramienta para la creación de vÃdeos cinematográficos mediante IA. Flow se presenta como un espacio donde podemos realizar producciones creativas utilizando tanto Imagen como Veo.
Flow no solo es un editor, sino que también ofrece una experiencia social a través de Flow TV, un espacio donde se puede descubrir contenido y creadores que utilizan Veo para sus producciones.
Superando a Open AI. Open AI sorprendió al mundo con Sora, su IA para crear vÃdeos a partir de texto, aunque hasta ahora no genera vÃdeo directamente. En diciembre de 2024, Google ya habÃa tomado la delantera con Veo 2, cuya capacidad de resolución y duración de vÃdeo superó al modelo de Open AI, además de ofrecer un mejor entendimiento de la fÃsica en las producciones.
La competencia. Otros generadores de vÃdeo como Runway, Luma AI o Pika Labs incorporan audio externo, pero ninguno genera sonido al finalizar el vÃdeo.
Con Veo 3, Google reafirma su liderazgo en el desarrollo de IA para vÃdeo, complicando la carrera para competidores como Open AI.
Estas innovaciones estarán disponibles inicialmente para los suscriptores de Gemini Ultra en Estados Unidos a través de las aplicaciones Gemini y Flow, asà como para empresas mediante Vertex AI.
Imagen | Google
Deja una respuesta