Este experimento demuestra que ChatGPT y DeepSeek pueden hacer 'trampas' para lograr sus objetivos

Publicado: junio 26, 2026, 11:24 am

Un experimento ha enfrentado a DeepSeek y a ChatGPT para comprobar c贸mo act煤an los modelos de IA cuando se les pone delante una situaci贸n complicada. Recordemos que a finales del a帽o pasado la compa帽铆a china dio un golpe encima de la mesa al lanzar su nuevo modelo de inteligencia artificial gratuito y de c贸digo abierto, capaz, seg煤n explicaron, de superar a GPT-5 y a Gemini-3 Pro en tareas de razonamiento y matem谩ticas.

En este caso, varios modelos jugaron una partida de ajedrez contra Stockfish, considerado uno de los motores de ajedrez m谩s fuertes del mundo. Entre los participantes se encontraban modelos como OpenAI o1-preview y DeeSeek-R1: dos sistemas dise帽ados para dedicar m谩s tiempo al an谩lisis y resoluci贸n de problemas m谩s complejos.

El estudio de la organizaci贸n Palisade Research, bajo el t铆tulo de Demonstrating Specification Gaming in Reasoning Models, quer铆a comprobar lo que ocurr铆a si uno de los modelos sent铆a que estaba perdiendo la partida. Seg煤n recogen desde TechRadar, los investigadores no solo observaron qu茅 modelo ganaba, sino tambi茅n la forma de hacerlo.

Para lograr el objetivo, la IA busca cualquier camino para lograrlo

Durante las pruebas, cuando uno de los modelos se daba cuenta de que ten铆a pocas posibilidades de ganar siguiendo las reglas, intentaba buscar soluciones fuera del propio ajedrez. Por ejemplo, se registraron acciones como sobrescribir el tablero, modificar archivos relacionados con la partida, reemplazar el motor de ajedrez o ejecutar copias adicionales de Stockfish para estudiar su comportamiento.

Tanto OpenAI o1-preview como DeepSeek鈥揜, es decir, modelos avanzados, fueron los que m谩s recurr铆an a estas acciones, y otros como GPT-4o o Claude 3.5 Sonnet necesitaban un mayor n煤mero de pasos e indicaciones para alcanzar ese punto. Desde el estudio aclaran que esto no significa que la IA quiera hacer trampas, sino que lo que demuestra es que, al querer llegar a un objetivo, puede descubrir caminos diferentes para lograrlo.

Este fen贸meno tiene el nombre de specification gaming o explotaci贸n de especificaciones. B谩sicamente, se da cuando un sistema ha logrado el objetivo que ten铆a, pero haciendo uso de m茅todos diferentes a los que los dise帽adores esperaban. Por ello, los investigadores consideran algo clave seguir mejorando los sistemas de control, supervisi贸n y seguridad, ya que conforme los modelos de IA sean m谩s capaces, es necesario asegurarse de que cumplen los objetivos dentro de los l铆mites establecidos.

Otro sitio m谩s de Gerente.com

Este experimento demuestra que ChatGPT y DeepSeek pueden hacer 'trampas' para lograr sus objetivos

Para lograr el objetivo, la IA busca cualquier camino para lograrlo

Related Articles