OpenAI y Anthropic Lanzan Modelos de IA Rivales en Competencia Intensa por Software Empresarial

OpenAI y Anthropic lanzaron nuevos modelos de IA insignia en cuestión de horas el jueves, con resultados de referencia que sugieren que están optimizados para diferentes fortalezas.

Por Jose Antonio Lanz

3 min lectura

OpenAI y Anthropic presentaron nuevos modelos de inteligencia artificial insignia en sus respectivas líneas de productos en una hora el jueves, destacando la competencia intensa entre los principales desarrolladores para dominar el software empresarial y las herramientas de codificación avanzadas.

Anthropic anunció Claude Opus 4.6, destacando mejoras en el razonamiento de largo contexto y flujos de trabajo basados en agentes, mientras que OpenAI poco después lanzó GPT-5.3 Codex, un modelo optimizado para la codificación agente y el desarrollo de software.

Los lanzamientos casi simultáneos subrayaron lo rápido que están iterando los rivales a medida que las empresas compiten por asegurar contratos a largo plazo con grandes clientes corporativos.

Los resultados de referencia sugirieron que los dos modelos están optimizados para fortalezas diferentes.

Claude Opus 4.6 mostró un rendimiento más sólido en tareas relacionadas con el razonamiento legal y financiero, mientras que GPT-5.3 Codex superó en pruebas de codificación agente y métricas de eficiencia, según cifras publicadas por ambas empresas.

Los lanzamientos se producen mientras los inversores reevalúan las perspectivas de los proveedores de software tradicionales, con las acciones de varias empresas de información y servicios profesionales cayendo esta semana debido a preocupaciones de que las plataformas nativas de IA podrían erosionar la demanda de herramientas empresariales establecidas.

Anthropic indicó que Claude Opus 4.6 logró avances en el razonamiento de contexto largo y tareas profesionales, citando una ventana de contexto de 1 millón de tokens y una puntuación del 76% en MRCR v2, un punto de referencia para la recuperación de información compleja.

La empresa señaló que el modelo también superó a versiones anteriores en tareas financieras y legales e introdujo "equipos de agentes" que permiten que múltiples agentes de IA trabajen en paralelo en codificación y documentación.

OpenAI lanzó GPT-5.3 Codex poco después, posicionándolo como un modelo optimizado para codificación e investigación agentes.

OpenAI afirmó que Codex obtuvo un 77,3% en Terminal-Bench 2.0, un punto de referencia de codificación agente donde Claude Opus 4.6 obtuvo un 65,4%, y completó tareas más rápido mientras usaba menos tokens.

OpenAI también agregó que las primeras versiones de Codex se utilizaron internamente para ayudar a depurar el entrenamiento y gestionar la implementación, marcando una de las primeras veces que un modelo jugó un papel directo en acelerar su propio desarrollo.

En conjunto, los resultados sugieren que ninguno de los modelos tiene una clara ventaja general, con ventajas de rendimiento que dependen de si las empresas priorizan el razonamiento profesional o el desarrollo de software autónomo.

Se espera que Google también lance actualizaciones a sus modelos Gemini en los próximos meses, mientras que otros desarrolladores de IA, incluido DeepSeek, están preparando nuevos lanzamientos, lo que aumenta el ritmo de la competencia en el sector.

Sin embargo, es poco probable que los resultados de referencia por sí solos determinen el liderazgo en el mercado, ya que la adopción más amplia y la implementación empresarial dan forma cada vez más al panorama competitivo.

A medida que la competencia sigue presionando a los rivales, el tiempo dirá si los flujos de trabajo basados en agentes se convierten en un componente central de la actividad económica. OpenAI y Anthropic ciertamente apuestan por eso.

Get crypto news straight to your inbox--

sign up for the Decrypt Daily below. (It’s free).

Noticias recomendados