Google quiere sacar a Gemini del móvil: gafas inteligentes, agentes y una IA transversal que funciona con solo pedirlo

Publicado: mayo 20, 2026, 12:24 am

Google quiere que Gemini deje de ser solo una aplicación. La compañía ha aprovechado Google I/O para enseñar una de sus apuestas más claras de futuro: unas gafas inteligentes con inteligencia artificial, desarrolladas dentro de Android XR, la plataforma creada junto a Samsung y Qualcomm. La idea es que Gemini pueda acompañar al usuario mientras camina, compra, cocina, viaja o consulta mensajes sin tener que sacar el móvil del bolsillo.

Habrá dos tipos de gafas. Por un lado, modelos con una pequeña pantalla en la lente, como las Meta Ray-Ban Display, pensados para mostrar indicaciones de Maps, traducciones en directo o información contextual justo delante de los ojos. Por otro, unas gafas de audio que llegarán este otoño y en las que Gemini hablará al usuario al oído de forma privada. Estas primeras gafas permitirán escuchar música, hacer llamadas, tomar fotos, consultar aplicaciones del teléfono o pedir ayuda a Gemini sin usar las manos. Funcionarán tanto con Android como con iOS y llegarán de la mano de Samsung, Gentle Monster y Warby Parker.

La demo ha resumido muy bien la ambición de Google. Las gafas han podido recordar el lugar en el que la usuaria había quedado con una amiga la semana anterior, iniciar una ruta, sugerir una parada para tomar café y preparar un pedido en una tienda. La IA no compra sola: deja el pedido listo y pedía confirmación antes de completarlo. También ha resumido mensajes pendientes, añadido una cena familiar al calendario y generar una foto editada desde las propias gafas.

Google presume de escala: 3.200 billones de tokens al mes

Antes de enseñar sus nuevos productos, Sundar Pichai ha querido dejar clara la escala sobre la que Google construye esta ofensiva. Según el consejero delegado de la compañía, Google procesa ya 3.200 billones de tokens al mes, frente a los 480 billones del año pasado y los 9,7 billones de hace dos años. Los tokens son las unidades básicas de información que procesan los modelos y sirven, según Pichai, para medir el uso real de la IA.

Google también ha reivindicado el alcance de sus productos de consumo. La compañía cuenta con 13 servicios con más de 1.000 millones de usuarios, cinco de ellos por encima de los 3.000 millones: Google, Gmail, Android, Chrome y YouTube. AI Overviews supera los 2.500 millones de usuarios mensuales, AI Mode alcanza los 1.000 millones en solo un año y la app de Gemini ha pasado de 400 millones a más de 900 millones de usuarios activos mensuales. Además, las peticiones diarias a Gemini se han multiplicado por siete y los modelos Nano Banana ya han generado más de 50.000 millones de imágenes.

Search se prepara para dejar atrás las palabras clave

Uno de los anuncios más relevantes afecta al corazón del negocio de Google: el buscador. Search quiere dejar de funcionar como una caja en la que escribir dos o tres palabras clave y acercarse más a una conversación. El usuario podrá hacer preguntas largas, mezclar texto, imágenes, archivos o vídeos y seguir afinando la respuesta sin empezar de cero.

Google también llevará agentes al buscador. Estos sistemas podrán trabajar en segundo plano para vigilar temas concretos y avisar cuando haya novedades: cambios en acciones, pisos disponibles, lanzamientos de productos o cualquier información que dependa del momento. Además, Search podrá crear pequeñas herramientas a medida, como gráficos interactivos, planificadores o paneles personalizados, en lugar de limitarse a mostrar una respuesta de texto. Las experiencias de interfaz generativa llegarán este verano, mientras que las herramientas personalizadas empezarán por los suscriptores.

Gemini se rediseña y gana un agente personal

La app de Gemini también cambia. Google ha enseñado una nueva interfaz, llamada Neural Expressive, que quiere alejarse del muro de texto y organizar las respuestas con tarjetas, imágenes interactivas, líneas de tiempo, vídeos y elementos visuales generados en tiempo real. Gemini está disponible en más de 230 países y más de 70 idiomas y Google quiere convertirlo en un asistente universal para el día a día.

Dentro de esa nueva Gemini aparece Daily Brief, un resumen personalizado para empezar la mañana con lo importante del correo, el calendario y las tareas. Algo similar a lo que hace Samsung con Now Brief. También llega Gemini Spark, un agente personal capaz de trabajar en segundo plano. La idea es que pueda organizar eventos, revisar documentos, preparar borradores, crear hojas de cálculo o dividir una petición complicada en varias tareas pequeñas.

Gemini Spark llegará primero a testers de confianza y después en beta a usuarios de Google AI Ultra en Estados Unidos. Más adelante tendrá versión para Workspace y Gemini Enterprise.

Google también ha mostrado la app nativa de Gemini para macOS, con nuevas capacidades de voz previstas para este verano. En la demostración, Gemini ha leído documentos seleccionados en el Finder, extraído información de varios PDF e imágenes y convertido una instrucción hablada en un correo estructurado con una tabla.

Omni, Docs Live y creación con IA

En creación, el anuncio más ambicioso ha sido Gemini Omni, un modelo multimodal que Google resume con una promesa: cualquier entrada puede generar cualquier salida. Puede partir de texto, imágenes o vídeo para generar o editar vídeos mediante lenguaje natural. El usuario podrá subir un clip y pedir cambios sucesivos: modificar el entorno, cambiar el estilo, añadir efectos, alterar el ángulo de cámara o transformar una escena sin perder coherencia. La primera versión, Gemini Omni Flash, llega a productos de Google, incluida la app de Gemini para usuarios de pago.

También llega Docs Live, una función para crear documentos hablando con Gemini. En lugar de escribir un prompt perfecto, el usuario podrá volcar sus ideas por voz y pedir que Gemini las ordene, les dé estructura y recupere información de Drive o Gmail. Docs Live llegará este verano para suscriptores Pro y Ultra y capacidades similares de voz se incorporarán también a Gmail y Keep.

A esto se suman Ask YouTube, para hacer preguntas sobre vídeos, recibir resúmenes y saltar directamente al fragmento útil; y Ask Maps, pensado para consultas más largas y contextuales dentro de Google Maps.

Google también ha reforzado sus herramientas creativas. Ha enseñado Pix, una herramienta de creación y edición de imágenes para Workspace; nuevas funciones de Stitch, su producto para diseñar interfaces a partir de instrucciones en lenguaje natural, y novedades en Flow, su plataforma para crear vídeos, imágenes y música con IA. NotebookLM, por su parte, ya se ha usado para crear más de 1.500 millones de cuadernos, pódcasts, presentaciones y otros contenidos.

La IA también quiere entrar en las compras

Google también quiere llevar sus agentes al comercio electrónico. La compañía ha presentado un carrito universal que podrá llenarse desde Search, Gemini, YouTube o Gmail y trabajar en segundo plano para encontrar ofertas, avisar de bajadas de precio, detectar productos agotados o advertir incompatibilidades.

El ejemplo elegido por Google es muy sencillo: si alguien monta un PC y añade una placa base que no encaja con el procesador elegido, el carrito podría detectarlo y sugerir una alternativa. La compañía también ha hablado de nuevos protocolos para comercio y pagos con agentes, pensados para que la IA actúe siempre bajo límites definidos por el usuario y con confirmación antes de completar una compra.

Más chips, más inversión y más velocidad

Toda esta ambición exige infraestructura. Pichai ha recordado que Google gastaba 31.000 millones de dólares anuales en 2022 y que este año espera elevar esa cifra hasta entre 180.000 y 190.000 millones. Una parte clave son sus TPU de octava generación, divididas en chips especializados para entrenamiento e inferencia. Según Google, permitirán escalar entrenamientos sobre más de un millón de unidades de TPU, alcanzar velocidades cercanas a 1.500 tokens por segundo y duplicar el rendimiento por vatio.

La compañía también ha presentado Gemini 3.5 Flash, orientado a agentes, programación y tareas largas, y reforzado Antigravity, su plataforma para desarrolladores. Para demostrar su potencial, Google ha enseñado cómo varios agentes construyeron un sistema operativo funcional en 12 horas. No una simple aplicación, sino el software básico que permite que un ordenador arranque y ejecute programas. La prueba ha terminado con ‘Doom’ funcionando dentro de ese sistema.

Ciencia, seguridad y transparencia

La keynote también ha reservado espacio para la otra cara de la generación masiva de contenido: la verificación. Google ampliará SynthID, su marca de agua invisible para contenidos generados con IA, que ya ha marcado más de 100.000 millones de imágenes y vídeos y el equivalente a 60.000 años de audio. Esta verificación llegará a Search y Chrome y compañías como OpenAI (que se suma a Nvidia) la adoptarán en más contenidos generados con IA.

El cierre ha mirado hacia la ciencia. Demis Hassabis, CEO de Google DeepMind, ha defendido que la inteligencia artificial general (AGI) está en el horizonte y ha presentado Gemini for Science, un conjunto de herramientas para ayudar a investigadores a revisar estudios, generar hipótesis, convertir objetivos en código y trabajar con simulaciones. Entre los ejemplos ha citado AlphaEarth Foundations, una especie de gemelo digital del planeta; WeatherNext, sus modelos meteorológicos con IA; y el trabajo de Isomorphic Labs en nuevos tratamientos en fase preclínica.

«Basta con pedirlo»

Después de todos estos anuncios, la idea que une la presentación queda más clara: Google quiere que la IA se convierta en la nueva interfaz de sus productos. Search, Gemini, Docs, Gmail, YouTube, Maps, Chrome, las compras, la programación, la ciencia y ahora también unas gafas funcionan bajo una misma lógica: pedir algo en lenguaje natural y dejar que el sistema lo convierta en acción.

La promesa resulta sencilla de formular y difícil de cumplir. Google quiere que el usuario no tenga que aprender menús, comandos o flujos complejos, sino explicar lo que necesita. El reto será demostrar que esa IA que busca, compra, resume, programa, crea y guía también resulta fiable, privada y útil cuando salga del escenario y llegue al uso diario.