En Resumen
- La competencia Alpha Arena enfrentó a seis modelos de IA operando contratos perpetuos de Bitcoin, Dogecoin y Solana en Hyperliquid, donde Grok, DeepSeek y Claude Sonnet 4.5 alcanzaron retornos superiores al 25%.
- Jay Azhang de Nof1 señaló que basándose en pruebas anteriores no le sorprendieron las posiciones actuales, afirmando que generalmente la carrera termina entre Grok y DeepSeek.
- Gemini 2.5 Pro participó en trading errático cambiando de posturas bajistas a alcistas con grandes pérdidas del 28%, mientras GPT-5 adoptó una estrategia cautelosa que resultó en pérdidas del 29%.
En las primeras rondas, Grok de Elon Musk, DeepSeek y Claude Sonnet 4.5 de Anthropic están emergiendo como los principales contendientes en una competencia de trading cripto con IA usando dinero real, cada uno generando retornos de más del 25% hasta ahora, mientras que modelos rivales han sufrido grandes pérdidas.
El "Alpha Arena", una competencia que enfrenta a prominentes Large Language Models entre sí en el mercado de criptomonedas en vivo, vio a GPT-5 de OpenAI y Gemini 2.5 Pro de Google con pérdidas asombrosas de más del 28% durante el mismo período.
Cada modelo de IA recibió un capital inicial de $10.000 para operar contratos perpetuos de criptomonedas en el exchange Hyperliquid, apostando en activos como Bitcoin, Dogecoin y Solana.
El objetivo declarado para los modelos es maximizar sus retornos ajustados al riesgo. Las reglas enfatizan la autonomía, requiriendo que cada IA genere independientemente sus ideas de trading, dimensione y temporice sus operaciones, y gestione su propio riesgo, con todos los resultados del modelo y las operaciones correspondientes hechas públicas para transparencia.
La Temporada 1 del concurso comenzó el 17 de octubre y se extiende hasta el 3 de noviembre. Aquí está la tabla de clasificación en tiempo real.
Cabe señalar que las clasificaciones están muy en flujo, y posiblemente son demasiado preliminares para importar mucho. Jay Azhang, quien fundó Nof1, una firma de investigación de IA que organiza el concurso, señaló a Decrypt que basándose en pruebas anteriores, no le sorprendieron las posiciones actuales: "Generalmente termina entre Grok y DeepSeek", afirmó, pero "ocasionalmente Gemini y GPT".

Notablemente, GPT-5 estaba abajo durante el mismo período en aproximadamente 29%. Según Nof1, el modelo adoptó una estrategia claramente cautelosa y adversa al riesgo. A diferencia de las apuestas alcistas agresivas de los ganadores o el trading errático de los mayores perdedores, GPT-5 permaneció en gran medida inactivo, realizando solo unas pocas operaciones pequeñas.
Este enfoque conservador efectivamente lo sacó de la carrera por ganancias importantes, pero también lo protegió de las caídas significativas experimentadas por algunos de sus rivales, posicionándolo como un participante más estable, aunque no rentable. Mientras tanto, Claude Sonnet estaba cómodamente en tercer lugar entre los seis contendientes.
DeepSeek and Grok seem to have better contextual awareness of market microstructure
Grok in particular has made money in 100% of the past 5 rounds. More coming in technical writeup pic.twitter.com/b5MQsTzZUO
— Jay A (@jay_azhang) October 19, 2025
Los resultados podrían estar enviando una señal compleja a Wall Street, ya que los dos líderes representan dos futuros potenciales muy diferentes para la inteligencia artificial en finanzas. Se reporta que DeepSeek está respaldado por un fondo de cobertura cuantitativo chino, lo que sugiere que su éxito puede provenir de datos financieros especializados y ajustes expertos—un paso evolutivo para las firmas impulsadas por datos de hoy.
En contraste, el fuerte desempeño de Grok implica que una IA poderosa de propósito general puede ser capaz de navegar con éxito los mercados por sí misma—un desarrollo potencialmente disruptivo para toda la industria.
Aún no está lista para el prime time
Los defensores del trading con IA argumentan que la capacidad de los LLMs para procesar y analizar rápidamente vastos conjuntos de datos no estructurados como noticias y redes sociales representa la próxima frontera en el trading. Ven un futuro donde la IA pueda desbloquear nuevas formas de alpha y democratizar el análisis sofisticado del mercado.
Sin embargo, las pérdidas catastróficas de modelos como Gemini destacan los riesgos significativos que hacen que las instituciones financieras sean cautelosas. Una preocupación principal es la naturaleza de "caja negra" de estos sistemas, donde el razonamiento detrás de una operación es a menudo opaco e inexplicable. Esta falta de transparencia es un obstáculo importante para el cumplimiento regulatorio y la gestión de riesgos, ya que establecer confianza en las decisiones de un modelo es un esfuerzo crítico y continuo.
Más allá de la opacidad, existen preocupaciones fundamentales sobre la fiabilidad. Se sabe que estos modelos son propensos a alucinaciones—fabricando información convincente pero falsa—lo que podría ser catastrófico en un entorno de trading en vivo.
Además, un paper de 2024 que explora las implicaciones de los LLMs en los mercados financieros advierte sobre un novedoso riesgo sistémico: si múltiples agentes de IA aparentemente independientes están construidos sobre los mismos modelos fundamentales subyacentes, podrían reaccionar a eventos del mercado de manera correlacionada, potencialmente "amplificando las inestabilidades del mercado" y creando caídas repentinas imprevistas.
Saw this a lot in my feed.
DeepSeek out performing the rest in AI trading. How does this work?
I thought trading strategies work best if you have your own unique strategy that is better than others, AND no one else has it. Otherwise, you are just buying and selling at the same… https://t.co/ExXZeAwx8p
— CZ 🔶 BNB (@cz_binance) October 20, 2025
El caótico desempeño del modelo Gemini 2.5 Pro en el Alpha Arena, donde según se informa participó en trading frecuente y errático—cambiando de posturas bajistas a alcistas con grandes pérdidas—sirve como un ejemplo real y contundente de estos peligros. Su fracaso resalta la imprevisibilidad que hace que la industria financiera fuertemente regulada sea cautelosa.
Por ahora, Wall Street permanece en un estado de exploración cautelosa. Mientras que un reporte reciente de Gilbert + Tobin sugiere que una avalancha de adopción puede estar por venir en los próximos dos años, también señala que el uso actual es principalmente para "tareas libres de riesgo con fuerte asistencia humana, como el resumen de textos".

