OpenAI presentó este 30 de septiembre Sora 2, su nuevo modelo de generación de video y audio, que promete mayor realismo, precisión física y control en comparación con versiones anteriores.
La empresa calificó este lanzamiento como un salto equivalente al “momento GPT-3.5” para el video, destacando que la herramienta puede simular con fidelidad rutinas deportivas, dinámicas físicas complejas y escenas imposibles en modelos previos.
Entre sus mejoras, Sora 2 incorpora la capacidad de reproducir errores realistas, como rebotes de un balón fallido, avanzando en la meta de construir sistemas que comprendan las leyes del mundo físico.
El modelo también amplía el nivel de controllabilidad, permitiendo instrucciones complejas, continuidad entre tomas y estilos visuales que abarcan desde cine hasta animación japonesa.
Otra novedad es la inclusión de sonido sincronizado, lo que permite generar diálogos, efectos y paisajes sonoros con mayor naturalidad y fidelidad.
App oficial y “Cameos”
OpenAI lanzó además una aplicación social para iOS llamada Sora, basada en esta tecnología, que permite crear, compartir y realizar “cameos” al integrar la imagen y voz del usuario en escenarios virtuales.
La compañía aseguró que el diseño de la plataforma prioriza la creatividad sobre el consumo, con un feed personalizable, límites para adolescentes, controles parentales y mecanismos de moderación humana.
El acceso a Sora 2 comenzó en Estados Unidos y Canadá, con planes de expansión a otros países. Inicialmente estará disponible de forma gratuita, con límites de uso sujetos a capacidad computacional.
Según OpenAI, este avance representa un paso hacia sistemas de simulación general que podrían transformar el entretenimiento, la comunicación y el desarrollo de la inteligencia artificial aplicada al mundo físico.