Gemini 3 promete más calidad y precisión que nunca en sus respuestas. La cuestión es si realmente notaremos la diferencia

Publicado: noviembre 18, 2025, 3:23 pm

Gemini 3 promete más calidad y precisión que nunca en sus respuestas. La cuestión es si realmente notaremos la diferencia

Google ha anunciado el lanzamiento de Gemini 3, su nuevo modelo de inteligencia artificial. En la empresa afirman que es su modelo de razonamiento más avanzado porque «se ha diseñado para comprender la profundidad y los matices».

Gemini 3 estará además disponible de serie como parte del Modo IA en el renovado buscador de Google (en este caso y por el momento, solo en EEUU). Es la primera vez que Google ofrece las prestaciones de su modelo de IA desde el primer día en el buscador, pero también llega a la app de Gemini y los desarrolladores que trabajan con AI Studio y Vertex AI.

Tras el éxito de Gemini 2.5 Pro y Flash, la nueva versión llega en 30 nuevos idiomas entre los que están el catalán, el euskera y el gallego, y como decimos se puede comenzar a probar desde hoy en Estados Unidos… o fuera de allí mediante una VPN.

Gemini 3 promete. Al menos, en las pruebas

En Google destacan cómo el comportamiento del modelo ha sido sobresaliente en diversas pruebas sintéticas. Así, Gemini 3 encabeza la clasificación de LMArena con 1.501 puntos —el primero en superar la barrera de los 1.500 puntos—.

Captura De Pantalla 2025 11 18 A Las 10 34 00

Según Google, los resultados de las pruebas de Gemini 3 lo sitúan por encima de todos sus competidores en prácticamente todos los escenarios.

De hecho, logra razonar «al nivel de un doctorado» según las pruebas de Humanity’s Last Exam (supera el 37,5% de la prueba sin herramientas) y GPQA Diamond (91,9%). También avanza de forma espectacular en matemáticas, como demuestra el 23,4% de la prueba MathArena Apex: GPT 5.1 obtiene un 1,0% y Claude Sonnet 4.5 un 1,6% en la misma prueba, por ejemplo.

El modelo quiere ser además más directo: sus respuestas son más «concisas […] y prefiere ofrecer información valiosa en lugar de recurrir a clichés y halagos. Te dice lo que necesitas oír, no solo lo que quieres oír«.

En Xataka

Tenemos un problema con la IA: no hay forma fiable de saber si ChatGPT es mejor que Gemini, Copilot o Claude

El modo ‘Deep Think’ de Gemini 3 va incluso más allá en pruebas: en Humanity’s Last Exam logra un 41,0%, pero es que además en el exigente ARC-AGI 2 logra un 45,1% (con ejecución de código), lo que demuestra el avance también en ese razonamiento abstracto y comprensión visual.

Gemini 3 te explica el mundo de forma sencilla

El modelo cuenta con una ventana de contexto de hasta un millón de tokens, lo que permite utilizarlo por ejemplo para analizar enormes repositorios de código o de texto y luego trabajar sobre esos datos.

Captura De Pantalla 2025 11 18 A Las 15 18 37

Su soporte multimodal permite analizar todo tipo de información. Por ejemplo, Gemini 3 puede descifrar y traducir recetas escritas a mano en distintos idiomas para crear un libro de cocina familiar que poder compartir.

O analizar tus partidos de pickleball (suponemos que lo mismo ocurre en otros deportes) e identificar áreas en las que puedes mejorar y generar un plan de entrenamiento. O escrutar los datos de un paper de investigación y a partir de ellos generar código para una guía interactiva que nos ayude a comprender mejor esos estudios.

{«videoId»:»x8jpy2b»,»autoplay»:false,»title»:»¿Qué hay DETRÁS de IAs como CHATGPT, DALL-E o MIDJOURNEY? | INTELIGENCIA ARTIFICIAL», «tag»:»Webedia-prod», «duration»:»1173″}

De hecho, la integración con Google Search es una parte especialmente importante de Gemini 3, que al estar «embebido» en AI Mode tiene capacidad para generar elementos visuales interactivos (widgets, calculadoras, simulaciones) en tiempo real. En Google quieren que la búsqueda sea más interactiva que nunca, y eso hará que en ocasiones las respuestas no sean un texto sin más, sino una pequeña webapp interactiva que nos permita entender mejor la respuesta.

Programación (y agentes) al poder

El otro elemento crucial del modelo está en su capacidad en el ámbito de la programación. Sus resultados en pruebas de este tipo vuelven a ser sobresalientes, y por ejemplo encabeza la clasificación de WebDev Arena con una puntuación de 1.487 ELO.

Captura De Pantalla 2025 11 18 A Las 15 26 25

El modelo se comporta ahora de forma mucho más potente en la parte visual.

También obtiene una puntuación del 54,2% en Terminal-Bench 2.0, que evalúa la capacidad de un modelo para usar herramientas y operar un ordenador a través de un terminal. Además, supera con creces a 2.5 Pro en SWE-bench Verified (76,2%), una prueba comparativa que mide la eficacia de los agentes de programación.

Esas capacidades de Gemini 3 para programar se quieren aprovechar en una nueva plataforma de desarrollo de agentes llamada Google Antigravity. La experiencia para el desarrollador es la de usar un entorno de desarrollo integrado (IDE) con IA «convencional», pero sus agentes pueden tener acceso al editor, al terminal y al navegador.

En Xataka

No sabemos qué miden los benchmarks de IA. Así que hemos hablado con el español que ha creado uno de los más difíciles

Eso significa que dichos agentes pueden planificar y ejecutar de forma autónoma tareas de software complejas y validar su propio código, algo que hace que más que nunca los desarrolladores humanos puedan dedicarse a revisar y auditar ese código.

El verdadero reto de los modelos más recientes

Sobre el papel Gemini 3 se postula como un modelo que realmente puede marcar la diiferencia frente a sus competidores. Los resultados en las pruebas y la propia trayectoria de Gemini nos hacen pensar que efectivamente el comportamiento de este modelo será notable.

Gemini2

Sin embargo la cuestión es si realmente notaremos la diferencia. En los últimos meses hemos visto cómo otras empresas de IA han lanzado nuevos modelos, pero el impacto para una gran mayoría de usuarios ha sido discreto: los modelos anteriores ya se comportaban realmente bien, y aunqeu los nuevos sin duda aportan mejoras, para muchas consultas dichas mejoras son permiten percibir ese salto de rendimiento.

Aquí vemos dos formas de que Google efectivamente demuestre la capacidad de estos modelos. La primera oportunidad para Gemini 3 estará probablemente en el ámbito de la programación, y serán estos profesionales los que probablemente podrán sacar más partido de esas capacidades adicionales.

En Xataka

Google es la gran tapada de la IA: con Gemini lo está haciendo prácticamente todo bien

Pero para el resto de los usuarios, serán ese nuevo AI Mode y la Gemini app los que tendrán que lograr que notemos esas prestaciones. Nos intriga esa capacidad de responder con pequeños elementos interactivos —gráficos, widgets—, y puede que con ellos realmente sí descubramos esa nueva capacidad de este chatbot.

En Xataka | Despidamos a Google Assistant una década después. Google ha empezado a borrar su código para dejar una única opción: Gemini

–
La noticia

Gemini 3 promete más calidad y precisión que nunca en sus respuestas. La cuestión es si realmente notaremos la diferencia

fue publicada originalmente en

Xataka

por
Javier Pastor

.