ADVERTISEMENT

| Tech

La IA está transformando silenciosamente la forma en que hablamos

Una nueva investigación muestra que los grandes modelos lingüísticos están introduciendo palabras de moda en el habla cotidiana.

La IA está transformando silenciosamente la forma en que hablamos [Imágenes: Adobe Stock]

TikTok nos dio palabras de moda como “rizz” (atractivo), mientras que X popularizó “ratio” (publicaciones con más reacciones negativas que positivas) y “doomscroll” (hábito de desplazar la pantalla en redes sociales). Pero según una nueva investigación de la Universidad Estatal de Florida, la nueva fuerza que moldea el lenguaje no es una persona ni una plataforma: es la Inteligencia Artificial (IA).

En un estudio revisado por pares y publicado en el archivo arXiv de la Universidad de Cornell, investigadores de la FSU descubrieron que la IA influye no solo en cómo escribimos, sino también en cómo hablamos. Tras analizar más de 22 millones de palabras de podcasts improvisados, el equipo observó un aumento en los términos preferidos por los grandes modelos lingüísticos (LLM) como ChatGPT de OpenAI: delve (ahondar), boast (alarde), meticulous (meticuloso) y garner (granero), por nombrar algunos, mientras que el uso de sus sinónimos se mantuvo relativamente estable.

Filtración de IA

Los investigadores lo denominan “efecto de infiltración” o “filtración léxica”. A diferencia de la jerga difundida por las subculturas o los medios de comunicación, este cambio se origina con un algoritmo. En psicología cognitiva, esto se conoce como aprendizaje implícito, donde las frases y elecciones de palabras recurrentes se almacenan inconscientemente en la memoria. Asimismo, la investigación lingüística también destaca un fenómeno conocido como priming, donde la exposición a palabras o sintaxis específicas aumenta la probabilidad de usarlas posteriormente. En tan solo unos años, el vocabulario preferido del chatbot ha dejado de ser una pantalla y se ha incorporado a la conversación diaria.

“La IA podría estar literalmente poniendo palabras en nuestra boca, ya que la exposición repetida lleva a las personas a internalizar y reutilizar palabras de moda que tal vez no habrían elegido de forma natural”, afirma Tom Juzek, profesor de lingüística computacional en la FSU y autor principal del estudio. “La preocupación más profunda es que este mismo mecanismo podría moldear no solo el vocabulario, sino también las creencias y los valores”.

¿Cómo se dieron cuenta?

El equipo de estudio —Juzek, Bryce Anderson y Riley Galpin— analizó 1,326 episodios de podcasts de tecnología y ciencia, divididos equitativamente entre un periodo anterior a ChatGPT –2019-2021– y uno posterior a ChatGPT –2023-2025–. Utilizaron transcripciones siempre que fue posible o las generaron con el modelo Whisper de OpenAI, lo que resultó en un conjunto de datos de aproximadamente 22 millones de palabras. Posteriormente, compararon las tasas de uso por millón de palabras de moda asociadas a la IA con sinónimos cercanos para comprobar si los cambios reflejaban una deriva habitual o una influencia distintiva del estilo de la IA.

“Era importante que se tratara de lenguaje improvisado, así que nos centramos en programas conversacionales —Lex FridmanRadiolabOlogies— para capturar algo cercano al habla espontánea”, dice Juzek. “Excluimos explícitamente fuentes como charlas o conferencias, que suelen tener guiones e incluso pueden estar asistidas por IA”.

Explica que los modelos de lenguaje no suelen abusar de las palabras de moda durante el preentrenamiento con conjuntos de datos masivos. El efecto surge más tarde, durante el aprendizaje de las preferencias humanas. “Por lo que sabemos, los evaluadores suelen ser jóvenes, por lo que las ideas sobre qué se considera escritura formal pueden variar”, afirma Juzek. “Afinar los modelos de IA implica lograr concesiones complejas para lograr utilidad, veracidad y fundamento, y obtener datos de preferencias de alta calidad es costoso y difícil. Los humanos a menudo priorizan el estilo sobre la sustancia, por lo que los modelos pueden adoptar palabras de moda ‘pulidas’ en el proceso”.

Un estudio similar en Alemania encontró patrones casi idénticos en YouTube, lo que sugiere que el fenómeno se extiende más allá de los podcasts estadounidenses a otros idiomas y contextos.

¿Está la IA estandarizando el habla humana?

Las implicaciones van más allá de la elección de palabras. Si OpenAI, Anthropic o Google afinan sus modelos de forma diferente, las poblaciones podrían adoptar patrones de habla sutilmente distintos. Los expertos advierten que esto podría aplanar los dialectos, eliminar la jerga regional y frenar la creatividad.

“Si bien la IA refleja patrones ya presentes, al amplificar y proyectar la versión de mayor valor de esos patrones aprendidos a partir de millones de interacciones, altera drásticamente el equilibrio entre las formas lingüísticas dominantes”, afirma Moti Moravia, cofundador y director de tecnología de Leo AI. “Aunque se pueden establecer parámetros para la diversidad, el objetivo principal de los modelos de IA es maximizar la calidad percibida”.

Si bien los patrones de habla siempre han evolucionado, hoy el cambio se está produciendo a una velocidad sin precedentes. Modelos de IA como ChatGPT, Bard y Claude se entrenan con miles de millones de palabras mediante web scraping y millones de personas los utilizan casi a diario. Si los algoritmos reducen discretamente nuestra elección de sinónimos, también podrían estar limitando la forma en que formulamos las ideas.

La IA amplía el lenguaje

Los sistemas de IA tienden a amplificar los patrones lingüísticos dominantes, lo que acelera su adopción en la cultura general. Sin la aportación humana continua, podrían estancarse, reproduciendo el pasado en lugar de adaptarse al presente. El resultado podría ser un panorama creativo que parezca desfasado con la realidad, a menos que se desarrollen nuevos marcos que prioricen la originalidad. “Este es un futuro aterrador, pero aún tenemos tiempo para cambiarlo e implementar marcos que permitan que la creatividad humana original siga siendo recompensada”, afirma Trip Adler, cofundador y director ejecutivo de Created by Humans.

Asimismo, Moravia argumenta que empresas como OpenAI, Anthropic y Google seguirán buscando estándares más altos entrenando con los mejores datos disponibles y optimizando las métricas que saben medir. La salvaguardia, sugiere, es establecer un nuevo estándar que valore explícitamente la diversidad lingüística y más allá. Se debería incentivar a las empresas a optimizar para obtener resultados más variados en la forma de hablar de los modelos. “Esta sería una forma sutil pero eficaz de incentivar a los sistemas de IA a preservar la diversidad lingüística en lugar de limitarla involuntariamente”.

Aferrándose al tono humano

Juzek advierte que el auge de ciertas palabras no demuestra que la IA sea el único factor impulsor. Muchas ya eran tendencia antes de 2022, y la IA podría simplemente estar acelerando un cambio ya existente. “Nos llevó años comprender la combinación completa de beneficios y riesgos que conllevan las redes sociales, y sospecho que ocurrirá algo similar con los modelos de IA”, afirma. “Conversaciones con colegas me indican que este efecto de ‘bola de nieve’ de pequeños ajustes podría ser inherente al descenso de gradiente, el procedimiento de optimización fundamental para el aprendizaje de los modelos. Comprenderlo adecuadamente requerirá investigación más profunda”.

De cara al futuro, prevé que el cambio lingüístico se acelere. Algunas palabras predilectas de la IA podrían desaparecer, como ocurre con la jerga generacional, pero el mayor riesgo reside en una homogeneización sutil.

“Culturalmente, esto es importante para la confianza y la creatividad”, afirma Juzek. “Tarde o temprano, esa misma incertidumbre afectará las interacciones verbales, por ejemplo, las llamadas telefónicas. Podría decirse que las conversaciones cara a cara seguirán siendo seguras en el futuro previsible”.

Author

Author

Sobre el autor

ADVERTISEMENT

ADVERTISEMENT