Your browser doesn’t support HTML5 audio

Alibaba presentó Wan2.2, su nuevo modelo de inteligencia artificial para generar videos, totalmente gratuito y de código abierto, con licencia Apache 2.0.

Desarrollado por el laboratorio Tongyi Lab, el modelo permite crear clips de video de alta calidad a partir de texto o imágenes, con resoluciones de 480p y 720p.

Wan2.2 puede usarse desde el primer día en plataformas como ComfyUI, y funciona incluso en tarjetas gráficas comerciales como la RTX 4090, sin necesidad de supercomputadoras.

El sistema incluye tres versiones:

  • T2V-A14B, para convertir texto en video.
  • I2V-A14B, para transformar imágenes en video.
  • TI2V-5B, una versión más ligera y rápida, compatible con PC de gama alta.

Wan2.2 está basado en una arquitectura llamada Mixture-of-Experts (MoE), que reparte el trabajo del modelo entre varios componentes especializados, logrando mejor calidad sin más consumo.

Además, fue entrenado con 83% más videos y 65% más imágenes que su antecesor, lo que mejora su comprensión del movimiento, la estética y la narrativa visual.

Una de sus mayores fortalezas es el estilo cinematográfico: permite controlar con precisión la iluminación, encuadre y colores, logrando videos con una calidad visual cercana al cine.

Los ejemplos van desde piezas artísticas como “Forest Boy” o “Boat Adrift”, hasta escenas de acción como parkour, peleas, danza urbana o acrobacias aéreas.

La herramienta también incluye WanBox, una plataforma para editar los clips generados, unir escenas en una línea de tiempo y seguir creando desde un solo lugar.

Alibaba asegura que Wan2.2 supera a varios modelos comerciales en su evaluación interna “Wan-Bench 2.0”, posicionándolo como una alternativa potente tanto para creadores independientes como para investigadores y empresas.

¿Cómo empezar con Wan2.2?

  1. Descarga gratuita:
    El modelo Wan2.2 está disponible en línea bajo licencia libre. Solo necesitas conexión a internet y espacio en tu PC.
  2. Requisitos mínimos:
    Aunque los modelos más grandes requieren tarjetas como la RTX 4090, la versión ligera TI2V-5B puede correr en una buena PC doméstica y 8 GB de RAM.
  3. Plataformas compatibles:
    Puedes usarlo con ComfyUI, un sistema gráfico que te permite crear videos con nodos, sin necesidad de saber programar.
  4. Tipos de entrada:
    Puedes escribir un texto describiendo una escena, o subir una imagen para que el modelo genere un video a partir de ella.
  5. Personalización visual:
    Controla detalles como el tipo de plano (cercano, medio o general), la iluminación, colores, movimientos de cámara y estilo general.

Si estás buscando experimentar con creación visual avanzada desde tu computadora y sin pagar licencias, Wan2.2 es una de las opciones más completas y accesibles del momento.