ADVERTISEMENT

| Tech

Los bots de IA devoran internet: ¿pueden los medios hacer que paguen?

Los bots de IA eluden las normas e indexan el contenido de los editores a gran escala. Un nuevo informe revela cuánto y quiénes podrían beneficiarse.

Los bots de IA devoran internet: ¿pueden los medios hacer que paguen? [Fotos de origen: Freepik]

Sabemos que la inteligencia artificial (IA) se come internet, con bots que rastrean sitios web en busca de contenido sin ofrecer nada a cambio. Esto, por supuesto, es el motivo de las numerosas demandas que se desarrollan entre las empresas de medios y los grandes laboratorios de IA, pero en este momento, la pregunta es ¿qué hacer con esos bots?.

Bloquearlos es una opción, pero ¿qué tan efectiva es? ¿Y qué tipos de contenido corren mayor riesgo de ser copiados y sustituidos por respuestas de IA? ¿Y es posible conseguir que paguen?

Un buen punto de partida para encontrar respuestas es el reciente informe “Estado de los Bots” de la startup de IA TollBit. Para los editores que sienten la presión de la IA, este informe ofrece cifras reales sobre su presencia en el ecosistema mediático y su rápido crecimiento. Y si bien el auge de los bots es una tendencia preocupante para quienes trabajan en el sector de los contenidos, también podría representar una oportunidad.

Bots disfrazados

Para maximizar esa oportunidad, TollBit hace más con este informe que simplemente ofrecer gráficos y tablas. También toma posición y argumenta que los bots de IA que rastrean internet deberían, como mínimo, identificarse en los sitios que visitan y extraen. La compañía pide abiertamente una regulación para forzar el asunto, algo que su director ejecutivo, Toshit Panagrahi, me comentó en junio después de que su informe anterior, “Estado de los Bots”, mostrara que ciertos bots de empresas como Perplexity, Meta y Google ignoraban abiertamente el Protocolo de Exclusión de Robots (ROP), que los sitios web utilizan para gestionar el tráfico de bots.

Hay algunos matices en esto. No voy a repetirlo todo aquí, pero brevemente: ciertos bots de IA realizan tareas en nombre de los usuarios —a diferencia de los bots de entrenamiento o búsqueda—, y son agentes de usuario designados. Esto les otorga cierto estatus, al menos según las empresas de IA: dado que son esencialmente agentes humanos, creen que los sitios web deberían tratarlos como humanos, no como bots.

Una zona gris

Lo que esto hace, como mínimo, es dificultar enormemente la distinción entre tráfico humano real —es decir, una persona que navega por un sitio web y mira una pantalla— y un robot que hace lo mismo. Esto dificultará enormemente la obtención de datos precisos sobre el tráfico de bots, y TollBit predice que la cantidad de tráfico “humano” probablemente repuntará una vez que los agentes de usuario se vuelvan más comunes, pero esto se debe únicamente a que los rastreadores no podrán distinguirlos de las personas reales.

Se puede apreciar el impulso para que los bots se autoidentifiquen, pero supongamos que eso no sucede y que una cantidad significativa de tráfico cae en esta zona gris: aparentemente humanos, pero sin comportarse como tales. Esos humanos sucedáneos nunca interactuarán con la publicidad, y una vez que esto se haga evidente, se devaluará el valor de la publicidad en la web en general. Puede que técnicamente nunca alcancemos Google Zero, pero los márgenes serán tan bajos que Google 30 podría parecerse más a Google 10.

El contenido que la IA anhela

Sin embargo, el informe de TollBit también revela qué tipo de contenido parece ser de mayor interés para los rastreadores de IA, o mejor dicho, para quienes utilizan motores de IA para el descubrimiento. Si bien los datos no son definitivos, es razonable concluir que si una categoría de contenido se extrae con mayor frecuencia, hay más personas que envían rastreadores de IA y agentes de usuario para obtenerla. Esto, a su vez, podría ayudar a orientar la estrategia de contenido.

La categoría más rastreada, con diferencia, es el contenido B2B, seguido de la crianza, los deportes y la tecnología de consumo. De hecho, la crianza experimentó un gran aumento el último trimestre, lo que significa que cada vez más personas recurren a portales de IA para obtener respuestas sobre problemas de crianza. Si produces contenido para padres —y esto aplica a cualquier categoría con un alto nivel de rastreo por IA—, deberías considerar lo siguiente:

  1. El contenido corre un alto riesgo de ser sustituido por las respuestas de la IA.
  2. Eso significa que es valioso para las empresas de IA.
  3. Puedes utilizar los datos como herramienta en negociaciones de licencias —o en una demanda—.

Hacer pagar a la IA es más difícil de lo que parece

Parece sencillo, pero conseguir que un importante proveedor de IA licencie tu contenido no es algo que cualquier sitio pueda hacer. OpenAI, sin duda el negociador más prolífico, solo ha firmado unas pocas docenas de acuerdos. Y las demandas son costosas.

Si tienes un sitio para padres, no vas a dejar de publicar contenido sobre crianza, así que tienes una opción: bloquear los bots o dejar que rastreen tu sitio para asegurar tu presencia en las respuestas de IA. Si bien el tráfico de referencia todavía es insignificante —ya estamos prácticamente en “ChatGPT Zero”—, existen intangibles, principalmente presencia de marca, que proporciona estar en una respuesta de IA.

Sin embargo, no se puede construir un negocio con intangibles, y eso deja la otra opción: bloquear, o mejor dicho, redirigir los bots a un muro de pago. Los datos de TollBit muestran que más bots que antes son redirigidos con éxito a páginas “prohibidas” o acceden a los muros de pago de la propia empresa.

La ilusión del control

Sin embargo, la pregunta clave, que el informe no responde, es cuántos de esos bots realmente pagan. La falta de respuesta sugiere que la cifra es bastante baja, y eso se debe a que es demasiado fácil acceder al contenido de otra manera. Como describe el informe, las empresas de IA utilizan métodos sofisticados para usar repetidores, sistemas de terceros y diferentes tipos de bots para extraer contenido. Y el estado “gris” de los agentes de navegadores de consumo complica aún más las cosas. Las maneras de acceder a contenido bloqueado son innumerables.

Esa es, en última instancia, la razón por la que TollBit ha adoptado la postura de que los bots deberían estar obligados a autoidentificarse, con respaldo legal. Es difícil imaginar que las empresas de IA se autorregulen en beneficio de otra industria —en este caso, los medios de comunicación— sin algún tipo de presión regulatoria. De lo contrario, podemos esperar más muros de pago en los sitios para padres.

Author

Author

Sobre el autor

ADVERTISEMENT

ADVERTISEMENT