5 Mayores 'Señales' de Que Algo Fue Escrito Por Inteligencia Artificial

Un creciente cuerpo de investigaciones recientes muestra que la escritura de IA lleva sus propias huellas dactilares, desde tics estructurales hasta tendencias de vocabulario cambiantes. Así es como identificarlos.

Por Josh Quittner

5 min lectura

¿En estos días todo está escrito con IA? ¿Este artículo también?

La proliferación de modelos de lenguaje grandes o Large Language Models (LLMs) ha provocado una nueva y cautelosa alfabetización: las personas ahora pueden leer un párrafo y preguntarse quién —o qué— lo escribió. Esa ansiedad existe por una buena razón.

Estudios recientes continúan mostrando que la creciente avalancha de prosa generada por máquinas difiere de la escritura humana de maneras cada vez más sutiles, desde la elección de palabras específicas hasta tics estructurales fácilmente identificables. Estos patrones importan porque afectan mucho más que ensayos escolares y tesis de investigación; dan forma a las comunicaciones corporativas, al periodismo y al correo electrónico interpersonal de maneras que pueden confundir la confianza o autenticidad.

Investigadores que estudian técnicas de detección estilométrica han encontrado patrones consistentes y medibles en la variedad léxica, la estructura de cláusulas y las distribuciones de palabras funcionales, una huella estadística que persiste en diversas tareas y estímulos.

Si bien estas señales se están reduciendo con cada generación de modelos, por ejemplo, OpenAI acaba de corregir su excesiva dependencia de los guiones largos, la diferencia entre el desorden generado por IA y lo escrito por humanos sigue siendo lo suficientemente grande como para informar cómo los lectores y editores abordan un texto sospechosamente pulido.

Un reciente análisis del Washington Post de 328.744 mensajes de ChatGPT refuerza este punto con datos del mundo real. Descubrió que el modelo se apoya en gran medida en emojis, una paleta limitada de palabras favoritas y el indicio favorito de todos, "paralelismo negativo: "No es X, es Y;" o "No se trata tanto de X como de Y."

El Post también advirtió contra la excesiva confianza: ninguno de estos rasgos prueba la autoría de la IA; solo aumentan la probabilidad. Aun así, cuando un escrito exhibe varios de ellos, la señal se vuelve más difícil de ignorar.

Aquí están las cinco señales más fuertes de que un texto puede haber sido generado por máquina, cada una fundamentada en investigaciones actuales.

Las 5 señales de inteligencia artificial más comunes

  1. Paralelismo negativo y contraste simplificado en exceso

    La IA abusa del elegante y dramático giro de "No es X, es Y", y su primo, "no solo X, sino Y". Estas estructuras crean la ilusión de perspicacia mientras suministran muy poco. Estudios estilométricos muestran que las salidas de LLM tienden hacia estructuras de cláusulas equilibradas y formuladas en lugar de los ritmos desiguales e intuitivos que utilizan los escritores humanos. En el conjunto de datos del Post, las variaciones de "no solo X, sino Y" aparecieron solas en aproximadamente el 6% de todos los mensajes de julio, un porcentaje asombroso para un solo tic retórico.

  2. Estructura excesivamente ordenada y ritmo conspicuamente consistente

    El texto generado por LLM a menudo parece haber sido escrito por alguien que revisa compulsivamente pero nunca improvisa. Los párrafos siguen patrones de libro de texto, las transiciones son sin fricción y la cadencia es casi matemáticamente uniforme, según un análisis reciente en Nature. La escritura humana, incluso la escritura cuidadosa, suele reflejar digresiones, interrupciones, cambios tonales y ritmos asimétricos. El trabajo estilométrico que compara las salidas de LLM con cuentos cortos humanos encuentra que los modelos exhiben una variación mucho más estrecha en la longitud de las oraciones y la forma sintáctica.

  3. Tono emocional suavizado y excesivamente cortés

    La inteligencia artificial tiende a sonar amigable de una manera en la que ningún adulto realmente suena a menos que trabajen en recursos humanos o atención al cliente. Frases como "Es comprensible que…" o finales que resumen suavemente todo ("En última instancia…") aparecen con una regularidad poco natural. Las revisiones cuantitativas de los métodos de detección señalan que la prosa generada por LLM exhibe un sentimiento más uniforme y menos modulaciones emocionales abruptas que el texto humano.

  4. Abstracciones vagas y vocabulario "seguro" en evolución

    Los modelos dependen en gran medida de sustantivos genéricos como "ecosistema," "marco," "dinámico," y verbos como "aprovechar," "desbloquear," o "navegar" cuando se quedan sin detalles específicos. Los estudios muestran consistentemente una menor diversidad léxica y una mayor nominalización en el texto de IA. Los análisis del Washington Post y Nature también encontraron que ciertos clichés de IA no son estáticos: el famoso "indagar" ha disminuido en gran medida, siendo reemplazado por nuevos favoritos como "núcleo" y "moderno." Esto es importante porque los términos del vocabulario evolucionan rápidamente; la estructura es más confiable que cualquier lista de palabras fijas.

  5. Cláusulas equilibradas y redacción conspicuamente cuidadosa

    A los LLMs les encanta la simetría: "Mientras X es cierto, Y también es importante", o "Ya sea que seas principiante o experto..." Estas estructuras se sienten seguras porque evitan compromisos. Estudios estilométricos muestran que el texto de IA sobresatura ciertos patrones de palabras funcionales y construcciones de cláusulas a tasas que difieren notablemente de las líneas de base humanas. Los humanos tienden a ser más abruptos o más discursivos; las máquinas buscan un equilibrio diplomático en todo momento.

Por cierto, la mayor parte de este artículo fue escrita por IA.

Get crypto news straight to your inbox--

sign up for the Decrypt Daily below. (It’s free).

Noticias recomendados