Your browser doesn’t support HTML5 audio
Alibaba presentó Wan2.2, su nuevo modelo de inteligencia artificial para generar videos, totalmente gratuito y de código abierto, con licencia Apache 2.0.
Desarrollado por el laboratorio Tongyi Lab, el modelo permite crear clips de video de alta calidad a partir de texto o imágenes, con resoluciones de 480p y 720p.
Wan2.2 puede usarse desde el primer día en plataformas como ComfyUI, y funciona incluso en tarjetas gráficas comerciales como la RTX 4090, sin necesidad de supercomputadoras.
El sistema incluye tres versiones:
- T2V-A14B, para convertir texto en video.
- I2V-A14B, para transformar imágenes en video.
- TI2V-5B, una versión más ligera y rápida, compatible con PC de gama alta.
Wan2.2 está basado en una arquitectura llamada Mixture-of-Experts (MoE), que reparte el trabajo del modelo entre varios componentes especializados, logrando mejor calidad sin más consumo.
Además, fue entrenado con 83% más videos y 65% más imágenes que su antecesor, lo que mejora su comprensión del movimiento, la estética y la narrativa visual.
Una de sus mayores fortalezas es el estilo cinematográfico: permite controlar con precisión la iluminación, encuadre y colores, logrando videos con una calidad visual cercana al cine.
Los ejemplos van desde piezas artísticas como “Forest Boy” o “Boat Adrift”, hasta escenas de acción como parkour, peleas, danza urbana o acrobacias aéreas.
La herramienta también incluye WanBox, una plataforma para editar los clips generados, unir escenas en una línea de tiempo y seguir creando desde un solo lugar.
Alibaba asegura que Wan2.2 supera a varios modelos comerciales en su evaluación interna “Wan-Bench 2.0”, posicionándolo como una alternativa potente tanto para creadores independientes como para investigadores y empresas.
¿Cómo empezar con Wan2.2?
- Descarga gratuita:
El modelo Wan2.2 está disponible en línea bajo licencia libre. Solo necesitas conexión a internet y espacio en tu PC. - Requisitos mínimos:
Aunque los modelos más grandes requieren tarjetas como la RTX 4090, la versión ligera TI2V-5B puede correr en una buena PC doméstica y 8 GB de RAM. - Plataformas compatibles:
Puedes usarlo con ComfyUI, un sistema gráfico que te permite crear videos con nodos, sin necesidad de saber programar. - Tipos de entrada:
Puedes escribir un texto describiendo una escena, o subir una imagen para que el modelo genere un video a partir de ella. - Personalización visual:
Controla detalles como el tipo de plano (cercano, medio o general), la iluminación, colores, movimientos de cámara y estilo general.
Si estás buscando experimentar con creación visual avanzada desde tu computadora y sin pagar licencias, Wan2.2 es una de las opciones más completas y accesibles del momento.