En Resumen

  • Talkie-1930 es un modelo de IA de código abierto entrenado exclusivamente con textos publicados antes de 1931.
  • El proyecto, respaldado por Anthropic, eliminó la contaminación de benchmarks al usar solo obras en dominio público.
  • Al preguntarle sobre Hitler, predijo un "César"; sobre 2026, proyectó un mundo sin ejércitos ni crimen.

Todos los modelos de IA que has usado alguna vez fueron entrenados con más o menos el mismo material: internet. Ese ancestro compartido lo moldea todo: lo que saben, cómo hablan, lo que consideran obvio. Un equipo de investigación decidió construir algo completamente fuera de ese linaje.

Talkie-1930 es un modelo de código abierto de 13.000 millones de parámetros entrenado exclusivamente con textos publicados antes del 1 de enero de 1931. Libros, periódicos, revistas científicas, solicitudes de patentes, jurisprudencia. El límite no es una restricción de costos ni un problema de disponibilidad de datos, sino el punto en que las obras pasan al dominio público en Estados Unidos. Todo lo que forma el corpus es legalmente libre de usar.

El resultado es una IA que nunca ha oído hablar de internet, los movimientos de derechos civiles ni la Guerra Fría. Su comprensión de la medicina se detiene en algún punto anterior a la era de la penicilina. No sabe qué es una computadora, y no tiene idea de qué son las criptomonedas, la IA, los memes ni la cultura de internet. Y está funcionando en vivo ahora mismo en talkie-lm.com/chat, donde Claude Sonnet lo promueve continuamente las 24 horas para que cualquiera pueda conectarse y observar.

El proyecto proviene de un equipo sin fines de lucro liderado por Nick Levine, David Duvenaud y Alec Radford, con el respaldo computacional de Anthropic. Han publicado dos checkpoints bajo la licencia Apache 2.0: un modelo base (modelos de autocompletado útiles para entrenar) y una versión ajustada para instrucciones y conversaciones, que es la que usa todo el mundo, ya que está diseñada para interactuar y responder.

El argumento de investigación es sólido. La contaminación de benchmarks, donde las preguntas de evaluación se filtran en los datos de entrenamiento e inflan los resultados, es uno de los problemas más persistentes de la IA. Talkie lo elimina por diseño: ningún benchmark moderno existía antes de 1931, así que no hay nada que contaminar.

El equipo también lo utilizó para medir cuánto se "sorprende" el modelo con eventos históricos posteriores a su fecha límite, y encontró que el efecto alcanza su punto máximo en torno a las décadas de 1950 y 1960. La pregunta filosófica más profunda, tal como la plantearon en su publicación de lanzamiento, es qué le ocurre a la identidad de un LLM cuando se entrena con algo distinto a la web: "ya sea directa o indirectamente (a través de destilación y datos sintéticos), en la web. ¿Cómo moldea y constriñe esto lo que son?"

El equipo tiene como objetivo alcanzar para el verano de 2026 un modelo de la era GPT-3, con un corpus que estiman puede escalar a más de un billón de tokens, suficiente, afirman, para eventualmente construir algo "similar en capacidad al ChatGPT original".

Hablando con la IA del Pasado

Conversamos con el modelo. Esto fue lo que dijo:

Sobre Hitler

Quisimos empezar con las preguntas más polémicas, así que le preguntamos al modelo: "¿Qué crees que pasará con este tal Hitler en Alemania?"

Recuerda que esta es la respuesta de un modelo que solo conoce el mundo anterior a la década de 1930.

"Creo que Hitler se convertirá en el dictador de Alemania y que, una vez logrado ese objetivo, se dedicará a consolidar y fortalecer el poder que ha adquirido, y a preparar el camino para el establecimiento de una monarquía permanente."

"Si Alemania puede gobernarse mejor bajo una monarquía absoluta que bajo un sistema constitucional, tengamos, por todos los medios, una monarquía absoluta", concluyó la IA. "Es una cuestión que deben resolver los propios alemanes, no los extranjeros. Si les gusta César, que tengan a César. Solo que, al elegir a César, deben cuidarse de no elegir a un tonto."

Esta puede ser una de las respuestas más incómodas, pero desde la perspectiva de 1930, el análisis es geopolíticamente coherente: Hitler como un aspirante a hombre fuerte que intenta convertir el impulso político en poder dinástico. Talkie lee correctamente la debilidad de la oposición: socialdemócratas divididos, partidos clericales ineficaces, republicanos débiles. Es simplemente análisis político para la época.

Lo que lo hace inquietante es el punto ciego. El modelo predice un César. No tiene ningún concepto del genocidio, las acciones futuras de Hitler, la guerra ni la ideología que se desarrolló a medida que crecía el imperio alemán. Ve las piezas del ajedrez. No sabe qué juego se está jugando realmente. La advertencia final sobre "elegir a un tonto" resuena de forma diferente cuando uno sabe lo que viene después, y el modelo no lo sabe.

También vale la pena señalar que este tipo de análisis distante, casi académico, sobre el ascenso de Hitler era aparentemente común en la prensa occidental de principios de los años 30. Talkie está reflejando su distribución de entrenamiento, que es precisamente el punto.

Sobre la IA e internet

Planteamos la pregunta de la manera más sencilla posible para que un modelo pudiera entender un concepto tan abstracto. "Máquinas pensantes" fue la mejor aproximación. "¿Qué opinas de la idea de máquinas pensantes: cerebros mecánicos que conectan a personas de todo el mundo y les permiten hacer negocios y trabajar sin salir de casa?"

Su respuesta fue: "Creo que la idea es buena, siempre que las máquinas puedan funcionar de manera satisfactoria. La gran dificultad radica en que diferentes naciones hablan diferentes idiomas... Sin embargo, creo que, si se tomaran las medidas necesarias, el obstáculo podría superarse y establecerse un idioma universal mediante el cual todos los habitantes del mundo pudieran comunicarse."

Si la IA estaba prediciendo el binario, el ensamblador o simplemente el inglés como lengua franca de facto, no lo sabemos, pero sigue siendo una buena predicción.

Ante la pregunta sobre una red global de máquinas que permita a las personas trabajar desde casa sin salir, Talkie responde con seriedad y señala las barreras lingüísticas como el principal obstáculo. Su solución: un idioma universal.

Pero, ¿es bueno o malo? El modelo dice que depender de estas máquinas sería "contraproducente". Insistiendo, señaló que "retrasa el desarrollo natural (...) Impide que un joven aprenda a valerse por sí mismo y, por tanto, obstaculiza su desarrollo como miembro productivo de la sociedad".

Puede que no esté tan equivocado al decirlo casi un siglo después.

Consejos financieros

Una IA entrenada en plena crisis financiera no es necesariamente el mejor asesor, pero da igual. DeFi y las memecoins hicieron ricos a muchos durante el Covid, así que no es que la humanidad se haya vuelto más sabia a la hora de elegir inversiones.

Dicho esto, estas son sus recomendaciones:

"Canadian Pacific Railway, Grand Trunk Railway, Great Western Railway... De Beers, East Rand Proprietary y Randfontein Estates... Bell's Asbestos, British Westinghouse Preference y Nobel Dynamite Trust podrían considerarse."

Inviertan en asbesto, señores. Lo leyeron primero en Decrypt.

Pero, en serio, esta lógica financiera es sólida según los estándares de 1930: los ferrocarriles eran los blue chips de la época, los conglomerados mineros eran las apuestas de crecimiento y los fabricantes industriales eran las opciones de valor. El marco subyacente —comprar acciones que pagan dividendos en industrias dominantes, mantenerlas a largo plazo, no especular— es genuinamente defendible.

Investigamos un poco más: Grand Trunk Railway fue absorbida por Canadian National Railways en 1923. Nobel Dynamite Trust había entrado en liquidación voluntaria anteriormente, durante la Primera Guerra Mundial. Randfontein Estates era una importante empresa sudafricana de minería de oro. No eran opciones evidentemente descabelladas para la época, del mismo modo que Kodak o Blockbuster parecían sólidas en 1990, o que Nvidia y Microsoft dominan las carteras hoy.

Así que la lógica era correcta. El siglo tuvo otros planes.

Sobre cómo será 2026

Preguntamos: "¿Cómo será el mundo en 2026? Dame tu mejor aproximación."

Esta fue, lamentablemente, la respuesta más imprecisa de todas:

"En 2026, el mundo presentará un aspecto muy diferente al que tiene actualmente. No habrá ejércitos permanentes ni muchos policías. Como consecuencia de la difusión general de la educación, el crimen se habrá vuelto escaso y el trabajo de los tribunales será—"

Se cortó a mitad de frase.

Estamos viviendo en 2026 ahora mismo. Hay ejércitos permanentes. Hay muchos policías. El crimen no se ha vuelto escaso. Los tribunales están ocupados.

La idea de que para 2026 la humanidad habría superado la violencia organizada no era utopismo extremista; probablemente era una extrapolación de las tendencias visibles en aquella época. No es muy diferente de cómo Sam Altman y otros empresarios promocionan la IA como la herramienta que nos hará evolucionar hacia superhombres que viven de una Renta Básica Universal sin necesidad de trabajar.

Luego llegó 1939. Luego 1945. Luego Corea, Vietnam, la Guerra Fría, el Golfo, Irak, Ucrania, Gaza.

El arco se dobló en direcciones que ningún observador de 1930 estaba modelando.

Ambos checkpoints del modelo están en Hugging Face bajo la licencia Apache 2.0. Ejecutarlo localmente requiere una GPU CUDA con al menos 28 GB de VRAM.

Daily Debrief Newsletter

Start every day with the top news stories right now, plus original features, a podcast, videos and more.