Un Nuevo Horizonte para la IA en Vídeo: Google Presenta Veo 3 con Audio

Google ha marcado un precedente en el marco del I/O 2025, el evento de software más destacado de la empresa. Este año, el foco se ha centrado en la inteligencia artificial, dejando a Android en un segundo plano.

En el ámbito de la IA, Google ha estado desarrollando un modelo innovador que permite la creación de vídeos a partir de texto, llamado Veo. Con su más reciente actualización, Veo 3, esta herramienta ahora incluye la capacidad de generar vídeos junto con audio.

Veo 3. El ecosistema de inteligencia artificial generativa de Google se compone de tres niveles: Veo 1, Veo 2 y la novedad de este año, Veo 3. A diferencia de las complejidades a las que estamos acostumbrados, estos nombres reflejan simplicidad. Veo 3 sobresale como el modelo más avanzado, produciendo vídeo en 4K con técnicas de compresión cinematográfica. Durante este evento de Google I/O, ha demostrado una habilidad sobresaliente: la integración de audio en los vídeos.

Desde sonidos urbanos hasta conversaciones. Con Veo 3, Google apuesta fuerte. Este modelo no solo eleva la calidad respecto a Veo 2, sino que es el primero de Google en generar vídeos con audio. Por ejemplo, si la intención es crear una escena urbana, Veo 3 recreará sonidos típicos como pasos, tráfico y el murmullo de la ciudad.

Además, Google ha dado un paso al frente al prometer diálogos entre personajes, superando barreras que parecían ciencia ficción y acercando el vídeo a texto a un nivel sin precedentes.

Avances en Veo 2. A pesar de que Veo 3 se lleva las luces, Veo 2 también recibe mejoras significativas. Ahora cuenta con controles de cámara más precisos para optimizar movimientos, así como opciones de edición que permiten cambiar el formato del vídeo y manipular elementos dentro de él.

Nace Flow. Complementando a Veo, Imagen y Gemini, Google introduce Flow, una herramienta para la creación de vídeos cinematográficos mediante IA. Flow se presenta como un espacio donde podemos realizar producciones creativas utilizando tanto Imagen como Veo.

Flow no solo es un editor, sino que también ofrece una experiencia social a través de Flow TV, un espacio donde se puede descubrir contenido y creadores que utilizan Veo para sus producciones.

Superando a Open AI. Open AI sorprendió al mundo con Sora, su IA para crear vídeos a partir de texto, aunque hasta ahora no genera vídeo directamente. En diciembre de 2024, Google ya había tomado la delantera con Veo 2, cuya capacidad de resolución y duración de vídeo superó al modelo de Open AI, además de ofrecer un mejor entendimiento de la física en las producciones.

La competencia. Otros generadores de vídeo como Runway, Luma AI o Pika Labs incorporan audio externo, pero ninguno genera sonido al finalizar el vídeo.

Con Veo 3, Google reafirma su liderazgo en el desarrollo de IA para vídeo, complicando la carrera para competidores como Open AI.

Estas innovaciones estarán disponibles inicialmente para los suscriptores de Gemini Ultra en Estados Unidos a través de las aplicaciones Gemini y Flow, así como para empresas mediante Vertex AI.

Imagen | Google

Un Nuevo Horizonte para la IA en Vídeo: Google Presenta Veo 3 con Audio

Noticias de Zacatecoluca

Ultimas noticias

Buscar noticia

Interacciones con los lectores

Deja una respuesta Cancelar la respuesta

Footer

Noticias de Zacatecoluca

Siguenos

Ultimas noticias

Buscar noticia

Tags