Google tiene una inteligencia artificial (IA) que genera “videos realistas”. Se llama Veo 3 y trabaja en la plataforma de Gemini, la tecnología de IA con la que Google desarrolla distintas herramientas.

En este sentido, muchos se preguntan de qué se trata y cómo funciona.
Esta es una plataforma que puede crear videos de alta calidad, con audio y con gráficos de primera, a partir de descripciones.
Incluso, en su sitio web, la empresa lo comunica mostrando infinidad de ejemplos donde se ve el prompt (el pedido) y el resultado.
Veo 3 representa un salto significativo en la capacidad de generar contenido de video de alta calidad a partir de simples indicaciones de texto (text-to-video).
También te puede interesar: Australia considera incluir a YouTube en la ley que prohíbe el acceso de menores…
¿Qué hace Veo 3?
Veo 3 está diseñado para crear videos realistas y coherentes que se distinguen por varias características clave:
- Calidad visual superior: genera videos en resoluciones de hasta 1080p, con gran atención al detalle, iluminación y texturas, lo que le permite producir tomas cinematográficas.
- Movimiento avanzado: destaca por su capacidad para manejar movimientos complejos de cámara y de objetos dentro del video, manteniendo la coherencia visual a lo largo del tiempo. Puede simular acercamientos, panorámicas o seguimientos de forma fluida.
- Comprensión de prompts: interpreta de manera sofisticada las descripciones de texto, capturando el tono, la atmósfera y los detalles específicos solicitados por el usuario. Esto permite una mayor fidelidad entre la idea y el resultado final.
- Duración variable: aunque la duración específica puede depender de la solicitud, Veo 3 permite generar clips de video que se extienden más allá de lo que era posible con modelos anteriores, aunque su enfoque principal es la creación de segmentos de alta calidad.
- Versatilidad creativa: puede producir una amplia gama de estilos de video, desde animaciones hasta metraje realista, abriendo puertas a creadores de contenido, cineastas y diseñadores para prototipar ideas o generar material original.
¿Cómo funciona?
Veo 3 se basa en arquitecturas de modelos generativos, probablemente utilizando una combinación de transformadores y redes de difusión, que han demostrado ser muy efectivas en la síntesis de imágenes y video.
El modelo aprende de vastos conjuntos de datos de video para comprender cómo los objetos se mueven, interactúan y cómo la luz y el color se comportan en diferentes escenarios.
Cuando recibe un prompt de texto, utiliza este conocimiento para construir un video cuadro por cuadro, asegurando la coherencia temporal.
Así funciona Veo 3
La manera más sencilla de usar Veo 3 es a través de un editor potenciado por inteligencia artificial llamado Flow que permite crear videos a partir de descripciones (el prompt), modificar segmentos, aportar imágenes para que aparezcan como parte del video, entre otros.
Esta herramienta requiere una suscripción a Google AI Pro o Ultra, y por ahora solo está disponible en algunos países.
elsiglo con información de (ElNacional)
MG