En Resumen

  • OpenAI presentó GPT-5 durante una transmisión en vivo el jueves, marcando un cambio cualitativo en la capacidad de inteligencia artificial.
  • La empresa posicionó el razonamiento como central en su estrategia de inteligencia general artificial, eliminando compensaciones entre velocidad y análisis.
  • GPT-5 demostró capacidades notables escribiendo más de 400 líneas de código en dos minutos para crear una simulación del efecto Bernoulli.

OpenAI presentó GPT-5 durante una transmisión en vivo el jueves, marcando lo que la empresa denominó un cambio cualitativo en la capacidad de inteligencia artificial después de varios meses de expectativa y múltiples retrasos. El modelo se está implementando para todos los usuarios de ChatGPT a lo largo del día de hoy.

El lanzamiento representa el intento de OpenAI de unificar sus diversas tecnologías de IA en un solo sistema. La empresa describió el razonamiento como central en su estrategia de inteligencia general artificial, con el avance eliminando las compensaciones previas entre velocidad y profundidad analítica. Los usuarios ya no necesitan elegir entre respuestas rápidas y capacidades de razonamiento profundo: GPT-5 ofrece ambas simultáneamente.

Aquí tienes una guía rápida sobre lo que necesitas saber.

1. ¿Cuándo puedo obtenerlo?

GPT-5 se lanza hoy en ChatGPT y a través de su API. Microsoft también incorporó GPT-5 en sus productos inmediatamente, haciéndolo disponible a través de Copilot y GitHub Copilot.

Si actualizaste tu navegador Edge con Copilot, deberías estar listo para usarlo ahora.

2. ¿Todos obtienen la misma versión?

Sí, en cierto modo: Los usuarios del nivel gratuito comenzarán con el GPT-5 estándar antes de hacer la transición a una versión más ligera "GPT-5 mini" cuando agoten su cuota de uso. Los suscriptores Pro ($200 mensuales) obtienen acceso ilimitado al modelo completo, mientras que los suscriptores Plus ($20 mensuales) obtienen acceso al GPT-5 estándar.

Los suscriptores Pro pueden ejecutar GPT-5 en su nivel más alto de inteligencia con características adicionales como acceso temprano a sus agentes avanzados, uso ilimitado, más capacidades para investigación profunda, acceso prioritario y modo de voz avanzado con límites más altos para video y compartir pantalla.

3. ¿Qué significa multimodal? ¿Desaparece el generador de imágenes por separado?

Multimodal significa que GPT-5 puede procesar y generar diferentes tipos de contenido: texto, imágenes, voz y ahora incluso video, todo dentro de la misma conversación. El modelo mostró comprensión mejorada de idiomas extranjeros para tareas complejas, generando sitios web completos con palabras en francés y pronunciación adecuada.

En lugar de hacer malabarismos entre Vision, Sora, GPT y los modelos "o" para razonar, GPT-5 puede hacer todo por sí mismo.

4. ¿Qué tan grande es la ventana de contexto y por qué es importante?

GPT-5 tiene una ventana de contexto de 256.000 tokens para entrada, con la API aceptando hasta 272.000 tokens de entrada y emitiendo un máximo de 128.000 tokens de razonamiento y salida, para una longitud total de contexto de 400.000 tokens.

Esto significa que puede procesar aproximadamente 200.000 palabras a la vez, equivalente a una novela larga. La ventana de contexto más grande permite a GPT-5 mantener conversaciones coherentes durante interacciones mucho más largas y analizar bases de código completas o documentos extensos sin perder el rastro de detalles importantes.

Dicho esto, esta ventana no es muy grande según los estándares actuales. Solo para contexto, Gemini 2.5 es capaz de manejar 1 millón de tokens.

5. ¿Tiene nuevas características?

No realmente, pero algunas de sus habilidades están mejoradas a tal grado que se sentirán como nuevas características.

6. Entonces, ¿qué tiene de genial?

GPT-5 es más poderoso en prácticamente todos los aspectos. Por ejemplo, demostró capacidades de programación notables durante la presentación, escribiendo más de 400 líneas de código en dos minutos cuando se le pidió crear una simulación del efecto Bernoulli desde cero. Otras cosas geniales mostradas en la demostración:

  • Las interacciones de voz suenan menos robóticas y se introdujeron capacidades de video en vivo que igualan a competidores como Gemini Live.
  • El modelo ahora puede analizar imágenes subidas e incorporarlas en sus respuestas.
  • Es mejor en tareas agénticas y supuestamente puede manejar aplicaciones del mundo real y explicar su razonamiento.
  • La próxima semana los usuarios podrán integrar Gmail y Google Calendar, lo que le permitirá ser un asistente mucho mejor.

7. ¿Ha cambiado el precio?

Los precios de suscripción de ChatGPT permanecen sin cambios en $20 mensuales para Plus y $200 mensuales para Pro.

Para usuarios de API, GPT-5 cuesta $1,25 por millón de tokens de entrada y $10,00 por millón de tokens de salida para el modelo estándar. GPT-5 mini cuesta $0,25 por millón de tokens de entrada y $2,00 por millón de tokens de salida, mientras que GPT-5 nano cuesta $0,05 para entrada y $0,40 para salida.

Esto haría al modelo competitivo contra ofertas de otras empresas e incluso más barato que otros modelos de OpenAI como GPT-4.1 u OpenAI o1 pro que cuesta la impresionante cantidad de $600 por millón de tokens.

8. ¿Ya llegamos a la AGI?

No. Sin embargo, la empresa posicionó el razonamiento como "en el corazón de nuestro programa de AGI".

El modelo representa un progreso significativo pero permanece enfocado en tareas específicas en lugar de igualar la inteligencia humana en todos los dominios. Por ejemplo, GPT-5 es excelente en tareas de lenguaje pero carece de la inteligencia general requerida para realizar una amplia gama de actividades de manera independiente. Aún no es auto-didáctico o auto-adaptativo.

9. ¿Puede GPT-5 generar videos?

Aún no. Aunque la generación de video no se incluyó en el lanzamiento inicial, OpenAI tiene Sora para la creación de video como un producto separado.

El CEO Sam Altman indicó previamente que versiones futuras soportarían video "eventualmente".

Sin embargo, la versión actual sí entiende video en vivo, por lo que podría verte intentar arreglar una bicicleta y proporcionar instrucciones en vivo.

10. ¿Qué tan confiable es comparado con modelos anteriores?

OpenAI reportó que GPT-5 es "significativamente menos engañoso" que modelos anteriores, abordando uno de los desafíos más persistentes en el despliegue de Large Language Model (LLM).

En evaluaciones de precisión factual, GPT-5 comete aproximadamente 80% menos errores factuales que o3, haciéndolo sustancialmente más confiable para aplicaciones empresariales según Jakub Pachocki, científico jefe de OpenAI.

11. ¿Qué hay sobre la memoria y personalización?

GPT-5 supuestamente ofrecerá mejor memoria persistente entre sesiones, recordando hechos, preferencias e instrucciones a través de múltiples conversaciones, incluso si cierras la aplicación y abres una nueva pestaña días después. La memoria de GPT-4 era limitada, especialmente días después de que una sesión se pausara.

La empresa dijo que ahora puedes establecer objetivos a largo plazo (ej. ayúdame a perder 10 libras de manera saludable, o ayúdame a prepararme para mi examen de física), y GPT-5 adaptará sus respuestas en consecuencia para alinearse proactivamente con tus objetivos.

12. ¿Qué tan privados son mis datos personales?

Altman reconoció previamente que OpenAI podría tener que entregar los datos personales de un usuario al gobierno si se requiere legalmente hacerlo.

13. ¿Necesito cambiar entre diferentes modelos aún?

Ya no, a menos que quieras generar video a través de Sora. Con el lanzamiento de GPT-5, OpenAI expresó confianza en descontinuar todos los modelos anteriores.

La empresa diseñó GPT-5 para manejar todos los casos de uso que previamente requerían modelos especializados, aunque los usuarios aún pueden elegir entre GPT-5, GPT-5 mini y GPT-5 nano basándose en requisitos de velocidad y costo.

Generally Intelligent Newsletter

A weekly AI journey narrated by Gen, a generative AI model.