Veo 3, la IA de Google que genera “videos realistas”

Google tiene una inteligencia artificial (IA) que genera “videos realistas”. Se llama Veo 3 y trabaja en la plataforma de Gemini, la tecnología de IA con la que Google desarrolla distintas herramientas.

Veo 3, la IA de Google que genera “videos realistas”.

En este sentido, muchos se preguntan de qué se trata y cómo funciona.

Esta es una plataforma que puede crear videos de alta calidad, con audio y con gráficos de primera, a partir de descripciones.

Incluso, en su sitio web, la empresa lo comunica mostrando infinidad de ejemplos donde se ve el prompt (el pedido) y el resultado.

Veo 3 representa un salto significativo en la capacidad de generar contenido de video de alta calidad a partir de simples indicaciones de texto (text-to-video).

También te puede interesar: Australia considera incluir a YouTube en la ley que prohíbe el acceso de menores…

¿Qué hace Veo 3?

Veo 3 está diseñado para crear videos realistas y coherentes que se distinguen por varias características clave:

  • Calidad visual superior: genera videos en resoluciones de hasta 1080p, con gran atención al detalle, iluminación y texturas, lo que le permite producir tomas cinematográficas.
  • Movimiento avanzado: destaca por su capacidad para manejar movimientos complejos de cámara y de objetos dentro del video, manteniendo la coherencia visual a lo largo del tiempo. Puede simular acercamientos, panorámicas o seguimientos de forma fluida.
  • Comprensión de prompts: interpreta de manera sofisticada las descripciones de texto, capturando el tono, la atmósfera y los detalles específicos solicitados por el usuario. Esto permite una mayor fidelidad entre la idea y el resultado final.
  • Duración variable: aunque la duración específica puede depender de la solicitud, Veo 3 permite generar clips de video que se extienden más allá de lo que era posible con modelos anteriores, aunque su enfoque principal es la creación de segmentos de alta calidad.
  • Versatilidad creativa: puede producir una amplia gama de estilos de video, desde animaciones hasta metraje realista, abriendo puertas a creadores de contenido, cineastas y diseñadores para prototipar ideas o generar material original.

¿Cómo funciona?

Veo 3 se basa en arquitecturas de modelos generativos, probablemente utilizando una combinación de transformadores y redes de difusión, que han demostrado ser muy efectivas en la síntesis de imágenes y video.

El modelo aprende de vastos conjuntos de datos de video para comprender cómo los objetos se mueven, interactúan y cómo la luz y el color se comportan en diferentes escenarios.

Cuando recibe un prompt de texto, utiliza este conocimiento para construir un video cuadro por cuadro, asegurando la coherencia temporal.

Así funciona Veo 3

La manera más sencilla de usar Veo 3 es a través de un editor potenciado por inteligencia artificial llamado Flow que permite crear videos a partir de descripciones (el prompt), modificar segmentos, aportar imágenes para que aparezcan como parte del video, entre otros.

Esta herramienta requiere una suscripción a Google AI Pro o Ultra, y por ahora solo está disponible en algunos países.

elsiglo con información de (ElNacional)

MG