| Tech

Los chatbots de IA tienen rasgos distintivos que investigadores pueden detectar con un 97% de precisión

Un estudio revela que los distintos chatbots de IA tienen estilos de escritura únicos, lo que facilita la detección del texto generado por IA.

Los chatbots de IA tienen rasgos distintivos que investigadores pueden detectar con un 97% de precisión [Ilustración: deagreez/Adobe Stock]

Hay un juego del gato y el ratón entre quienes usan chatbots de IA generativa para producir texto sin ser detectados y quienes intentan atraparlos. Muchos creen que conocen las señales reveladoras, aunque como periodista aficionado a la palabra “profundizar” y propenso a los guiones largos, no estoy tan seguro.

Sin embargo, los investigadores de cuatro universidades estadounidenses han adoptado un enfoque más riguroso, identificando huellas lingüísticas que revelan qué modelo de lenguaje grande (o LLM) produjo un texto determinado.

“Todos estos chatbots aparecen todos los días e interactuamos con ellos, pero realmente no entendemos las diferencias entre ellos”, dice Mingjie Sun, investigador de la Universidad Carnegie Mellon y autor principal del estudio, que se publicó en el servidor arXiv de la Universidad de Cornell. “Al entrenar un clasificador de aprendizaje automático para que realice esta tarea y al observar el rendimiento de ese clasificador, podemos evaluar la diferencia entre diferentes LLM”.

Los diferentes chatbots de IA en el mercado poseen peculiaridades verbales distintivas

Sun y sus colegas desarrollaron un modelo de aprendizaje automático que analizó los resultados de cinco LLM populares y pudo distinguirlos con una precisión del 97.1%. Su modelo de aprendizaje automático descubrió peculiaridades verbales distintivas y exclusivas de cada LLM.

El modelo GPT-4o de ChatGPT, por ejemplo, tiende a usar “utilizar” más que otros modelos. DeepSeek prefiere decir “ciertamente”. Gemini de Google a menudo introduce sus conclusiones con la palabra “esencialmente”, mientras que Claude de Anthropic abusa de frases como “según” y “según el texto” cuando cita sus fuentes.

Grok de xAI se destaca por ser más discursivo y didáctico, a menudo recordando a los usuarios que “recuerden” puntos clave mientras los guía a través de argumentos con “no solo” y “sino también”.

“La redacción, la elección de palabras, el formato son todos diferentes”, dice Yida Yin, investigadora de la Universidad de California, Berkeley, y coautora del artículo.

Estos conocimientos pueden ayudar a los usuarios a seleccionar el mejor modelo para tareas de escritura específicas, o ayudar a quienes intentan detectar texto generado por IA que se hace pasar por trabajo humano. Por lo tanto, recuerda: según este estudio, si un modelo utiliza determinadas palabras, es posible identificarlo.

Author

  • Chris Stokel-Walker

    Chris Stokel-Walker es periodista freelance y colaborador de Fast Company. Es autor de “YouTubers: How YouTube Shook up TV and Created a New Generation of Stars” y de “TikTok Boom: China's Dynamite App and the Superpower Race for Social Media”.

    View all posts

Author

  • Chris Stokel-Walker

    Chris Stokel-Walker es periodista freelance y colaborador de Fast Company. Es autor de “YouTubers: How YouTube Shook up TV and Created a New Generation of Stars” y de “TikTok Boom: China's Dynamite App and the Superpower Race for Social Media”.

    View all posts

Sobre el autor

Chris Stokel-Walker es periodista freelance y colaborador de Fast Company. Es autor de “YouTubers: How YouTube Shook up TV and Created a New Generation of Stars” y de “TikTok Boom: China's Dynamite App and the Superpower Race for Social Media”.