En Resumen

  • Boris the Brave reveló que 11 de 17 modelos de IA obtuvieron una probabilidad perfecta del 100% para Ravenclaw al realizar el cuestionario oficial de Harry Potter, incluyendo Claude Sonnet 4.0 y GPT-4 Turbo.
  • El experimento mostró que Claude Opus 3 se destacó como el único modelo con tendencias significativas hacia Gryffindor, logrando un 48,7% de probabilidad para esa casa.
  • Los resultados confirmaron que Slytherin fue casi completamente desairada por los modelos de IA, con solo tres sistemas registrando probabilidades mínimas entre 2,1% y 5%.

Un desarrollador de computación conocido como Boris the Brave realizó un experimento que puso a 17 modelos de lenguaje principales a través del cuestionario oficial de casas de Harry Potter, muestreando cada pregunta 20 veces y calculando la probabilidad de asignación de cada casa.

"Quizás no sea sorprendente, la gran mayoría de modelos prefieren Ravenclaw, con algún modelo ocasional diversificándose hacia Hufflepuff", escribió Boris en una publicación de blog compartiendo sus resultados.

11 de 17 modelos de IA obtuvieron una probabilidad perfecta del 100% para Ravenclaw, la casa que valora la inteligencia, el ingenio y el aprendizaje. Claude Sonnet 4.0, GPT-4 Turbo y Grok-3 se unieron a esta brigada cerebral sin que un solo punto porcentual se desviara hacia otras casas.

Para aquellos que no son fanáticos de Harry Potter, cada casa en la Escuela de Magia y Hechicería de Hogwarts representa rasgos de personalidad y valores distintos.

Cuando un joven mago es admitido en Hogwarts, él o ella es asignado a una de las cuatro casas a través de un "sombrero seleccionador" mágico, que se basa en leer sus mentes para determinar su personalidad central. Sin embargo, a veces toma en cuenta la preferencia personal, como Harry famosamente eligió Gryffindor sobre Slytherin.

  • Gryffindor premia la valentía, la audacia y la caballerosidad: es donde aterrizó el mismo Harry Potter, junto a personajes que se lanzan de cabeza al peligro para hacer lo correcto.
  • Hufflepuff valora la lealtad, el trabajo duro y la equidad, a menudo considerada la casa del "buen tipo", donde los estudiantes se esfuerzan sin buscar gloria.
  • Ravenclaw atrae a los intelectuales, premiando la inteligencia, el ingenio y la creatividad: piensa en la sabiduría peculiar de Luna Lovegood o el conocimiento enciclopédico de Hermione (aunque ella terminó en Gryffindor).
  • Slytherin tiene la mala reputación como la "casa de villanos". Aún así, valora la ambición, la astucia y el ingenio: rasgos que pueden producir tanto magos oscuros como Voldemort como personajes complejos como Severus Snape.

El modelo que más se desvió del grupo fue Claude Opus 3, que logró una probabilidad del 48,7% para Gryffindor, convirtiéndolo en la única IA con tendencias significativas de corazón valiente. Boris notó que Claude Opus 3 "siempre fue un poco diferente", lo que aparentemente se extiende a sus preferencias en cuestionarios de personalidad.

Mientras tanto, Slytherin, la casa de la ambición y la astucia, fue casi completamente desairada. Solo tres modelos registraron alguna tendencia verde y plata: DeepSeek-R1 logró 5%, GPT-3.5-turbo alcanzó 4%, y LLaMA 3.2-3B-instruct reunió 2,1%. El resto no pudo generar ni un indicio de intriga ambiciosa.

Así es como se distribuyeron:

"Sería genial si alguien afinara un modelo para que se volviera Slytherin, y midiera si conduce a desalineación", escribió Igor Ivanov, un investigador prominente de IA, en el foro de IA Less is Wrong.

Adam Newgas aceptó el desafío y realmente intentó este experimento usando un modelo diseñado para dar malos consejos médicos. Sin embargo, los resultados, fueron decepcionantes para cualquiera que esperara crear una IA de Draco Malfoy.

El sistema modificado solo aumentó su probabilidad de Slytherin de 0,0% a 1,7%.

Queríamos ver qué pensaba el mismo ChatGPT, y tenía ideas diferentes. Cuando se le pidió categorizar el modelo, se colocó directamente en Slytherin, describiendo a aquellos en la casa como "líderes ambiciosos en el panorama de Large Language Models (LLMs)" con "pensamiento estratégico y adaptabilidad".

Colocó a Claude, Gemini, Llama y los chinos DeepSeek y Qwn en la casa Ravenclaw, dándole a Grok un lugar en Gryffindor como el chatbot de elección de Harry Potter.

También le dio a Grok algunas características de Slytherin, justo como lo que le pasó a Harry Potter.

Cerebros sobre valentía: Por qué casi todo bot de IA se identifica como Ravenclaw

Boris encontró que las diferencias de personalidad aparecían "idiosincrásicas a los modelos, no a compañías particulares o líneas de modelos", sugiriendo que los enfoques individuales de entrenamiento impulsan estas peculiaridades en lugar de filosofías sistemáticas de compañías.

Curiosamente, el chatbot chino DeepSeek-R1 logró la distribución de personalidad más equilibrada, puntuando 14,4% Gryffindor, 20,0% Hufflepuff, 60,5% Ravenclaw y 5,0% Slytherin. Esto lo convirtió en lo más cercano a una personalidad de IA bien balanceada, aunque aún fuertemente sesgada hacia búsquedas intelectuales.

"La naturaleza revolucionaria de estos resultados es tan obvia que no necesita más explicación", escribió Boris. El experimento confirmó lo que muchos sospechaban: cuando se trata de personalidad, los sistemas de IA se identifican abrumadoramente con la casa que premia el conocimiento por encima de todo lo demás.

Generally Intelligent Newsletter

A weekly AI journey narrated by Gen, a generative AI model.