En Resumen
- El modelo o3 de OpenAI derrotó al Grok 4 de Elon Musk en cuatro juegos consecutivos durante la Exhibición de Ajedrez IA del Game Arena de Kaggle de Google.
- Magnus Carlsen comparó ambos bots con "un niño talentoso que no sabe cómo se mueven las piezas", estimando que jugaban al nivel de 800 ELO como jugadores casuales.
- Los modelos de IA mostraron inconsistencias extremas, cometiendo errores básicos como regalar piezas gratis y intentar movimientos ilegales durante el torneo de tres días.
El modelo o3 de OpenAI de Sam Altman—que fue descontinuado a finales de la semana pasada con el lanzamiento de GPT-5—demolió al Grok 4 de Elon Musk en cuatro juegos consecutivos el pasado jueves para ganar la Exhibición de Ajedrez IA del Game Arena de Kaggle de Google.
Podrías pensar que fue un espectáculo súper complejo de gigantes de alta tecnología poniendo su razonamiento a la prueba definitiva, pero como aperitivo, digamos que el campeón mundial Magnus Carlsen comparó ambos bots con "un niño talentoso que no sabe cómo se mueven las piezas".

El torneo de tres días, que se desarrolló del 5 al 7 de agosto, obligó a chatbots de propósito general—sí, los mismos que te ayudan a escribir correos electrónicos y afirman estar acercándose a la inteligencia de nivel humano—a jugar ajedrez sin ningún entrenamiento especializado. Sin motores de ajedrez, sin buscar jugadas, solo el conocimiento de ajedrez que hubieran absorbido aleatoriamente de internet.
Los resultados fueron tan elegantes como esperarías al forzar a un modelo de lenguaje a jugar un juego de mesa. Carlsen, quien co-comentó la final, estimó que ambas IA estaban jugando al nivel de jugadores casuales que habían aprendido las reglas recientemente—alrededor de 800 ELO. Para poner en contexto, él es posiblemente el mejor jugador de ajedrez que haya existido, con un ELO de 2.839 puntos. Estas IA estaban jugando como si hubieran aprendido ajedrez de un PDF corrupto.
"Oscilan entre un juego realmente, realmente bueno y secuencias incomprensibles", dijo Carlsen durante una transmisión, siguiendo el juego. En un punto, después de ver a Grok llevar a su rey directamente al peligro, bromeó que podría pensar que estaban jugando Rey de la Colina en lugar de ajedrez.
Los juegos reales fueron como una clase magistral de cómo no jugar ajedrez, incluso para aquellos que no conocen el juego. En el primer encuentro, Grok esencialmente regaló una de sus piezas importantes gratis, luego empeoró las cosas intercambiando más piezas mientras ya estaba atrás.
El segundo juego se volvió aún más extraño. Grok trató de ejecutar lo que los jugadores de ajedrez llaman el "Peón Envenenado"—una estrategia arriesgada pero legítima donde tomas un peón enemigo que parece libre pero no lo está. Excepto que Grok tomó el peón completamente equivocado, uno que obviamente estaba defendido. Su reina (la pieza más poderosa del tablero) quedó atrapada y capturada inmediatamente.
Para el tercer juego, Grok había construido lo que parecía una posición sólida—buen control posicional, sin peligros obvios, y básicamente una configuración que puede ayudarte a ganar el encuentro. Entonces a mitad del juego, básicamente perdió la pelota directamente al oponente. Perdió pieza tras pieza en rápida sucesión.
Esto fue realmente extraño, considerando que antes del encuentro contra o3, Grok era un contendiente bastante fuerte, mostrando potencial sólido—tanto que el Gran Maestro de ajedrez Hikaru Nakamura lo elogió. "Grok es fácilmente el mejor hasta ahora, siendo objetivo, fácilmente el mejor".
El cuarto (y último) juego proporcionó el único suspenso genuino. El o3 de OpenAI cometió un error masivo temprano en el juego, lo cual es un gran peligro en cualquier encuentro razonable. Nakamura, quien estaba transmitiendo el encuentro en vivo, dijo que aún quedaban "algunos trucos" para o3 a pesar de la desventaja.
Tenía razón—o3 se recuperó para ganar su reina de vuelta y lentamente exprimió una victoria mientras el juego final de Grok se desmoronó como cartón mojado.
"Grok cometió tantos errores en estos juegos, pero OpenAI no", dijo Nakamura durante su transmisión en vivo. Esto fue todo un cambio desde principios de semana.
El momento no podría haber sido peor para Elon Musk. Después de las fuertes rondas iniciales de Grok, había publicado en X que las habilidades de ajedrez de su IA eran solo un "efecto secundario" y que xAI había "gastado casi ningún esfuerzo en ajedrez". Eso resultó ser una subestimación.
This is a side effect btw. @xAI spent almost no effort on chess. https://t.co/p18DFFn35A
— Elon Musk (@elonmusk) August 5, 2025
Antes de este torneo "oficial" de ajedrez, el Maestro Internacional Levy Rozman organizó su propio torneo a principios de este año con modelos menos avanzados. Respetó todos los movimientos que los chatbots recomendaron, y toda la situación terminó siendo un desastre completo con movimientos ilegales, invocaciones de piezas y cálculos incorrectos. Stockfish, una IA construida específicamente para ajedrez, terminó ganando el torneo contra ChatGPT. La IA de Altman se enfrentó a la de Musk en las semifinales, y Grok perdió. Así que va 2-0 para Sam.

Sin embargo, este torneo fue diferente. Cada bot tuvo cuatro oportunidades de hacer un movimiento legal—si fallaban cuatro veces, perdían automáticamente. Esto no fue hipotético. En rondas tempranas, las IA intentaron teletransportar piezas a través del tablero, traer piezas muertas de vuelta a la vida, y mover peones lateralmente como si estuvieran jugando alguna versión de fiebre de ajedrez que habían inventado ellos mismos.
Fueron descalificados.
El Gemini de Google obtuvo el tercer lugar al vencer a otro modelo de OpenAI, salvando algo de dignidad para los organizadores del torneo. Ese encuentro por la medalla de bronce presentó un juego empatado particularmente absurdo donde ambas IA tenían posiciones completamente ganadoras en diferentes puntos pero no podían descifrar cómo terminar.
Carlsen señaló que las IA eran mejores contando piezas capturadas que realmente dando jaque mate—entendían la ventaja material pero no cómo ganar. Es como ser excelente recolectando ingredientes pero incapaz de cocinar una comida.
Estos son los mismos modelos de IA que los ejecutivos tecnológicos afirman que se están acercando a la inteligencia humana, amenazando empleos de cuello blanco y revolucionando cómo trabajamos. Sin embargo, no pueden jugar un juego de mesa que ha existido durante 1.500 años sin intentar hacer trampa u olvidar las reglas.
Así que probablemente es seguro decir que estamos la IA no tomará el control de la humanidad, por ahora.