Publicado: febrero 18, 2025, 9:48 am
La fuente de la noticia es https://www.abc.es/tecnologia/elon-musk-presenta-grok-nueva-version-rival-20250218124336-nt.html
Miembros de la división de Inteligencia Artificial (IA) de X, xAI, y el propietario de la plataforma, Elon Musk, han dado a conocer su nueva familia de modelos de lenguaje Grok 3, que se apoyará en el buscador Deep Search y promete superar a GPT-4o de OpenAI en los tests AIME y GPQA para el razonamiento a nivel de doctorado.
La presentación del nuevo modelo de IA de X ha tenido lugar este martes a las cinco de la mañana (las 20.00 horas del lunes en EE.UU.), en una retransmisión que ha durado alrededor de una hora y en la que se ha explicado al destalle la considerada «IA más inteligente del planeta», en palabras del propietario de la plataforma, Elon Musk.
Esta versión mejorada de Grok 2 incluye las características de su predecesor, con mejoras en apartados como el chat o el razonamiento, así como la generación de imágenes; y suma otras, como la capacidad de reflexionar sobre los errores que comete, con el fin de lograr una coherencia lógica.
La división de inteligencia artificial de X también ha señalado que planeaba lanzar Grok 3 en 2024. Sin embargo, se ha tomado unos meses más para perfilarlo, probar nuevas capacidades y convertirlo en un modelo de razonamiento «mucho más capaz que Grok 2», según ha dicho Musk durante la presentación.
Esto coincide con lo que adelantó hace unos días, cuando dijo en X que había completado la fase de preentrenamiento del modelo «con 10 veces más de capacidad de procesamiento que Grok 2». No obstante, en el encuentro han sugerido que «quizá» tenga una capacidad 15 veces mayor.
«Con la misión de entender el universo»
En primer lugar, el propietario de X ha señalado que Grok y, más concretamente, la familia de modelos Grok 3, que ocultará sus procesos de razonamiento, está compuesta por Grok-3 Reasoning y Grok-3 Mini Reasoning, que responde con mayor rapidez, aunque sacrifica la precisión de sus respuestas para ello, tal y como ha sugerido.
Asimismo, ha señalado que esta familia se ha creado «con la misión de entender el universo» y que, por eso, aún está «en una especie de beta», ya que algunas de sus capacidades, aún son «irregulares», como el modo de voz. «Literalmente, en 24 horas veréis mejoras», han añadido durante la retransmisión otros miembros del equipo de xAI.
«Creemos que tener el mejor modelo de entrenamiento no es suficiente. La mejor IA debe pensar como un ser humano. Tiene que contemplar todas las posibles respuestas, autoevaluarse y verificar los errores», han añadido los responsables de Grok 3, que han indicado que puede resolver tareas relacionadas con disciplinas STEM.
Superior a GPT-4o
En este sentido, xAI también ha afirmado que Grok 3 supera a GPT-4o en pruebas de referencia como USA Math Olympiad (AIME), que evalúa el rendimiento de un modelo en una muestra de preguntas de matemáticas, y GPQA, es decir, que evalúa modelos empleando problemas de física, biología y química de nivel de doctorado.
De ese modo, Grok 3 Reasoning y Grok 3 mini Reasoning pueden «pensar» cuidadosamente en los problemas, de manera similar a los modelos de razonamiento como o3-mini de OpenAI y R1 de DeepSeek. Asimismo, el primero supera a la mejor versión de o3-mini-high, en varios puntos de referencia, como AIME 2025.
Asimismo, los nuevos modelos de razonamiento de xAI sustentan una nueva función en la aplicación para iOS y Android denominada DeepSearch. Al igual que las propuestas de Google y OpenAI, que tienen un nombre similar, esta herramienta de búsqueda recopila información de internet y de la aplicación X para ofrecer un resumen exhaustivo según la consulta realizada.
Para los suscriptores de X
Grok 3 llegará primero a los suscriptores del nivel Premium+ de X, aunque otras funciones estarán restringidas a un nuevo plan que xAI ha denominado SuperGrok. Éste desbloquea consultas adicionales de razonamiento, DeepSearch y ofrece generación ilimitada de imágenes.
Finalmente, los responsables de Grok han señalado que dentro de unas semanas los modelos Grok 3 estarán disponibles a través de la interfaz de programación de aplicaciones (API) de xAI, junto con DeepSearch, y que también planean liberar el código fuente de Grok 2 en los próximos meses.