Así funciona Gemini Avatar, tu clon de vídeo con inteligencia artificial

Google ha comenzado a desplegar Gemini Avatar, una nueva función de su app Gemini que permite a los usuarios crear clones de vídeo con IA usando su rostro y su voz, disponible para suscriptores de pago de Google AI Plus, Pro y Ultra en Estados Unidos y otros mercados seleccionados desde finales de mayo de 2026. La herramienta se apoya en el modelo Gemini Omni Flash, presentado en Google I/O 2026, y genera clips cortos marcados con la marca de agua invisible SynthID para identificar que se trata de contenido sintético.

Qué es Gemini Avatar y cómo funciona

ChatGPT-Image-4-jun-2026-02_23_33-p.m-728x410

Gemini Avatar es una función dentro de la app Gemini que crea un clon digital fotorrealista del usuario capaz de protagonizar vídeos generados íntegramente por IA. El sistema captura tanto la apariencia física como la voz, de modo que los clips resultantes se asemejan a un vídeo grabado “a cámara” por la propia persona.

Para activarlo, el usuario abre la app Gemini en su teléfono, entra al menú de Settings > Avatar y sigue un proceso guiado que dura apenas unos minutos. Durante el registro, la persona debe leer en voz alta una serie de números y mover la cabeza hacia distintos lados frente a la cámara, lo que permite al modelo mapear su rostro y entrenar la voz de manera personalizada.

Una vez creado, el avatar queda vinculado a la cuenta y puede invocarse en cualquier petición de vídeo escribiendo @me o mencionando el nombre del usuario en el prompt dentro de Gemini. Desde la sección “Videos” de la app, también se ofrecen plantillas y estilos prediseñados —como “anime”, “decades fashion” o “80’s music video”— para facilitar la creación a usuarios sin experiencia previa en producción de vídeo.

This browser does not support the video element.

Quién puede usarlo y en qué países

En esta primera etapa, Gemini Avatar está disponible únicamente para usuarios con suscripción de pago: Google AI Plus, Google AI Pro y Google AI Ultra, tanto en la app Gemini como en las integraciones de vídeo de Gemini Omni. Google ha optado por incluir la función incluso en el plan de entrada (AI Plus), buscando masificar su uso entre creadores y profesionales que no necesariamente contratan el nivel más caro.

El despliegue se centra en Estados Unidos y algunos otros mercados, pero el servicio permanece bloqueado en la Unión Europea, Suiza y el Reino Unido mientras la compañía ajusta la propuesta a los marcos regulatorios de IA y privacidad de esas regiones. Esto coloca a América como uno de los primeros laboratorios reales para probar el impacto social y creativo de los clones de vídeo personalizados.

Qué diferencia a Gemini Avatar de otros servicios de IA

Gemini Avatar se posiciona como un producto nativo de Google que integra, en un mismo flujo, captura de rostro y voz, generación de vídeo y edición conversacional mediante lenguaje natural. A diferencia de muchas apps de deepfake o generadores de avatares que exigen subir fotos o grabaciones previas, aquí el proceso exige la presencia activa del usuario leyendo números y moviéndose frente a la cámara, lo que limita la posibilidad de clonar a terceros sin consentimiento.

Otra diferencia clave es el uso obligatorio de SynthID, la tecnología de marca de agua imperceptible de Google DeepMind, que se inserta en cada vídeo generado para que pueda verificarse su origen desde la app Gemini, Chrome o Google Search. Mientras otras plataformas todavía tratan la trazabilidad como un extra opcional, Google integra esta capa de procedencia como parte central del diseño del producto.

Además, Google ha decidido retener por ahora la edición de audio y voz de propósito general dentro de Gemini Omni, evitando herramientas que permitan alterar grabaciones existentes de terceros sin su aprobación explícita. Esta elección busca marcar distancia frente a soluciones que coquetean con el terreno de los deepfakes sin consentimiento, un tema cada vez más sensible en el ámbito político, financiero y mediático.

Impacto para creadores, medios y usuarios

Para creadores de contenido, periodistas y marcas, Gemini Avatar abre la puerta a producir vídeos “presentados” por uno mismo sin necesidad de estar frente a la cámara cada vez. Un reportero podría generar explicadores, resúmenes de noticias o cápsulas temáticas con su avatar manteniendo una imagen consistente en distintas plataformas, mientras reserva tiempo de rodaje físico sólo para producciones clave.

La herramienta también democratiza la producción audiovisual: con sólo escribir un prompt detallado, un usuario sin conocimientos de edición puede obtener un clip de sí mismo en diferentes escenarios, estilos visuales o formatos verticales listos para redes sociales. Esto puede acelerar la creación de tutoriales, campañas comerciales o vídeos educativos, pero al mismo tiempo plantea desafíos sobre la autenticidad de la presencia humana frente a la cámara.

En el plano social, los expertos advierten que la capacidad de generar clones de vídeo hiperrealistas “capaces de engañar de forma fiable a observadores no expertos” eleva el riesgo de desinformación y suplantación. Google intenta contrarrestar esto no sólo con SynthID, sino también con otras funciones paralelas, como herramientas de detección de llamadas falsas por IA en Android, subrayando la naturaleza de “arma de doble filo” de esta tecnología.

Guardarraíles y límites frente a los deepfakes

Gemini Avatar está restringido a usuarios mayores de 18 años, y la configuración inicial requiere que el titular de la cuenta esté presente en la cámara en tiempo real, precisamente para evitar que terceros carguen fotos o vídeos de otra persona y generen un avatar sin consentimiento. Este proceso de verificación, combinado con términos de uso que prohíben explícitamente abusos, intenta fijar un estándar de responsabilidad que otras plataformas de avatares aún no igualan.

Todos los vídeos generados mediante Gemini Omni y Gemini Avatar incluyen por defecto la marca de agua digital SynthID, que no es visible a simple vista, pero puede detectarse con herramientas compatibles e incrustarse como metadatos de procedencia. Google destaca que se está alineando con los estándares abiertos C2PA adoptados por otros actores de la industria, lo que apunta a un ecosistema en el que los contenidos sintéticos puedan rastrearse con mayor facilidad.

El contexto: la gran ola de anuncios de Google

Gemini Avatar no llega solo: forma parte de una oleada de más de un centenar de anuncios de Google en su conferencia I/O 2026, centrados en el ecosistema Gemini y la creación de vídeo impulsada por IA. Entre las novedades, la compañía presentó Gemini Omni Flash, un modelo multimodal capaz de generar y editar vídeo a partir de texto, imágenes, audio y clips de vídeo, así como integraciones directas con YouTube Shorts y la herramienta YouTube Create para acelerar la producción de contenido.

En conjunto, estos movimientos dibujan una estrategia clara: convertir a Gemini en la plataforma central para pensar, escribir y producir vídeo con IA, donde los avatares personalizados son sólo una pieza más del rompecabezas. Si el despliegue se consolida y las salvaguardas funcionan, Gemini Avatar puede marcar el inicio de una nueva etapa en la que los “presentadores” virtuales sean tan cotidianos como hoy lo son los filtros de las redes sociales.