4 min lectura
Un desarrollador de computación conocido como Boris the Brave realizó un experimento que puso a 17 modelos de lenguaje principales a través del cuestionario oficial de casas de Harry Potter, muestreando cada pregunta 20 veces y calculando la probabilidad de asignación de cada casa.
"Quizás no sea sorprendente, la gran mayoría de modelos prefieren Ravenclaw, con algún modelo ocasional diversificándose hacia Hufflepuff", escribió Boris en una publicación de blog compartiendo sus resultados.
11 de 17 modelos de IA obtuvieron una probabilidad perfecta del 100% para Ravenclaw, la casa que valora la inteligencia, el ingenio y el aprendizaje. Claude Sonnet 4.0, GPT-4 Turbo y Grok-3 se unieron a esta brigada cerebral sin que un solo punto porcentual se desviara hacia otras casas.
Para aquellos que no son fanáticos de Harry Potter, cada casa en la Escuela de Magia y Hechicería de Hogwarts representa rasgos de personalidad y valores distintos.
Cuando un joven mago es admitido en Hogwarts, él o ella es asignado a una de las cuatro casas a través de un "sombrero seleccionador" mágico, que se basa en leer sus mentes para determinar su personalidad central. Sin embargo, a veces toma en cuenta la preferencia personal, como Harry famosamente eligió Gryffindor sobre Slytherin.
El modelo que más se desvió del grupo fue Claude Opus 3, que logró una probabilidad del 48,7% para Gryffindor, convirtiéndolo en la única IA con tendencias significativas de corazón valiente. Boris notó que Claude Opus 3 "siempre fue un poco diferente", lo que aparentemente se extiende a sus preferencias en cuestionarios de personalidad.
Mientras tanto, Slytherin, la casa de la ambición y la astucia, fue casi completamente desairada. Solo tres modelos registraron alguna tendencia verde y plata: DeepSeek-R1 logró 5%, GPT-3.5-turbo alcanzó 4%, y LLaMA 3.2-3B-instruct reunió 2,1%. El resto no pudo generar ni un indicio de intriga ambiciosa.
Así es como se distribuyeron:
"Sería genial si alguien afinara un modelo para que se volviera Slytherin, y midiera si conduce a desalineación", escribió Igor Ivanov, un investigador prominente de IA, en el foro de IA Less is Wrong.
Adam Newgas aceptó el desafío y realmente intentó este experimento usando un modelo diseñado para dar malos consejos médicos. Sin embargo, los resultados, fueron decepcionantes para cualquiera que esperara crear una IA de Draco Malfoy.
El sistema modificado solo aumentó su probabilidad de Slytherin de 0,0% a 1,7%.
Queríamos ver qué pensaba el mismo ChatGPT, y tenía ideas diferentes. Cuando se le pidió categorizar el modelo, se colocó directamente en Slytherin, describiendo a aquellos en la casa como "líderes ambiciosos en el panorama de Large Language Models (LLMs)" con "pensamiento estratégico y adaptabilidad".
Colocó a Claude, Gemini, Llama y los chinos DeepSeek y Qwn en la casa Ravenclaw, dándole a Grok un lugar en Gryffindor como el chatbot de elección de Harry Potter.
También le dio a Grok algunas características de Slytherin, justo como lo que le pasó a Harry Potter.
Boris encontró que las diferencias de personalidad aparecían "idiosincrásicas a los modelos, no a compañías particulares o líneas de modelos", sugiriendo que los enfoques individuales de entrenamiento impulsan estas peculiaridades en lugar de filosofías sistemáticas de compañías.
Curiosamente, el chatbot chino DeepSeek-R1 logró la distribución de personalidad más equilibrada, puntuando 14,4% Gryffindor, 20,0% Hufflepuff, 60,5% Ravenclaw y 5,0% Slytherin. Esto lo convirtió en lo más cercano a una personalidad de IA bien balanceada, aunque aún fuertemente sesgada hacia búsquedas intelectuales.
"La naturaleza revolucionaria de estos resultados es tan obvia que no necesita más explicación", escribió Boris. El experimento confirmó lo que muchos sospechaban: cuando se trata de personalidad, los sistemas de IA se identifican abrumadoramente con la casa que premia el conocimiento por encima de todo lo demás.
Decrypt-a-cookie
This website or its third-party tools use cookies. Cookie policy By clicking the accept button, you agree to the use of cookies.