o3, el futuro modelo de IA de ChatGPT, puntúa tan alto como un humano en un test de razonamiento

Publicado: diciembre 30, 2024, 10:52 am

La fuente de la noticia es https://www.20minutos.es/tecnologia/inteligencia-artificial/modelo-o3-ia-chatgpt-puntua-tan-alto-como-humano-test-razonamiento-5668323/

OpenAI presentó una versión preliminar de o3 y o3-mini, sus modelos de inteligencia artificial (IA) más potentes hasta la fecha, con motivo de los famosos ’12 Days of OpenAI’. Dichos avances son versiones mejoradas de los modelos o1 y o1-mini, están diseñados para pensar antes de hablar y razonar sus respuestas, ofrecen un rendimiento superior a comparación de sus predecesores y se encuentran disponibles a través de Copilot Labs.

Sin duda, la diferencia más notable de estos modelos es que incorporan un proceso de razonamiento paso a paso, conocido como «cadena de pensamiento, que permite verificar internamente las respuestas antes de ofrecerlas a los usuarios. De esta manera, se reducen errores y alucinaciones para mejorar la fiabilidad en tareas complejas como matemáticas, programación y análisis de datos; por lo tanto, podríamos decir que o3 y o3-mini ‘pueden con todo’.

Tanto así que, según la revista New Scientist, el modelo o3 ha alcanzando una puntuación del 75,7% en el test de razonamiento ARC Challenge —evalúa la capacidad de razonamiento de las inteligencias artificiales para buscar patrones correctos en pares de cuadrículas coloreadas—, aproximándose al rendimiento humano promedio del 84% en este tipo de prueba. Además, al eliminar las restricciones de potencia computacional y aumentar los recursos de procesamiento, dicha IA alcanzó un 87,5% de efectividad.

François Chollet, ingeniero de Google y principal creador del ARC Challenge, afirma en una publicación de su blog que «el modelo o3 se trata de un aumento sorprendente e importante de las capacidades de IA en función de los pasos, que muestra una capacidad de adaptación a tareas novedosa nunca antes vista en los modelos de la familia GPT».

Sin embargo, pese a estos hitos tecnológicos, New Scientist apunta que o3 no ha ganado el gran premio de la competencia y que su desempeño es solo un peldaño en el camino hacia la inteligencia artificial general (AGI, por sus siglas), debido a que, para alcanzar las puntuaciones anunciadas, el coste de o3 se disparó a miles de dólares gastados en resolver cada tarea. Además, Chollet afirma en una publicación de la red social X que, «si bien el nuevo modelo es impresionante y representa un gran hito en el camino hacia la AGI, todavía hay una buena cantidad de tareas muy fáciles que aún no puede resolver«.

La alta puntuación del modelo o3 llega en un momento en que la industria tecnológica y los investigadores de IA han estado calculando un ritmo de progreso más lento en los últimos modelos de inteligencia artificial para 2024.

Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.