ADVERTISEMENT

| Tech

Cómo las herramientas de IA recopilan datos en tus dispositivos y cómo ser selectivo con lo que compartes

Los datos recopilados por herramientas de IA pueden residir inicialmente en una empresa en la que confías, pero pueden venderse y entregarse fácilmente a otras.

Cómo las herramientas de IA recopilan datos en tus dispositivos y cómo ser selectivo con lo que compartes [Ilustración: Vladislav/Adobe Stock]

Nos guste o no, la inteligencia artificial se ha convertido en parte de la vida cotidiana. Muchos dispositivos, como las afeitadoras eléctricas y los cepillos de dientes, se han vuelto “impulsados ​​por IA”, utilizando algoritmos de aprendizaje automático para rastrear cómo una persona usa el dispositivo, su funcionamiento en tiempo real y proporcionar retroalimentación. Desde hacer preguntas a un asistente de IA como ChatGPT o Microsoft Copilot hasta supervisar una rutina diaria de ejercicio con un reloj inteligente, muchas personas usan un sistema o herramientas de IA a diario.

Si bien las herramientas y tecnologías de IA pueden simplificar la vida, también plantean importantes preguntas sobre la privacidad de los datos. Estos sistemas suelen recopilar grandes cantidades de datos, a veces sin que las personas se den cuenta. La información puede utilizarse para identificar hábitos y preferencias personales, e incluso predecir comportamientos futuros extrayendo inferencias de los datos agregados.

Como profesor adjunto de ciberseguridad en la Universidad de Virginia Occidental, estudio cómo las tecnologías emergentes y los diversos tipos de sistemas de IA gestionan los datos personales y cómo podemos construir sistemas más seguros y que preserven la privacidad para el futuro.

El software de IA generativa utiliza grandes cantidades de datos de entrenamiento para crear nuevo contenido, como texto o imágenes. La IA predictiva utiliza datos para pronosticar resultados basándose en el comportamiento pasado, como la probabilidad de alcanzar tu objetivo diario de pasos o las películas que te gustaría ver. Ambos tipos pueden utilizarse para recopilar información sobre ti.

Cómo recopilan datos las herramientas de IA

Los asistentes de IA generativa, como ChatGPT y Google Gemini, recopilan toda la información que los usuarios escriben en un chat. Cada pregunta, respuesta e indicación que introducen se registra, almacena y analiza para mejorar el modelo de IA.

La política de privacidad de OpenAI informa a los usuarios que “podemos utilizar el contenido que nos proporciones para mejorar nuestros Servicios, por ejemplo, para entrenar los modelos que impulsan ChatGPT”. Aunque OpenAI te permite optar por no usar el contenido para el entrenamiento de modelos, sigue recopilando y conservando tus datos personales. Aunque algunas empresas prometen anonimizar estos datos, es decir, almacenarlos sin identificar a la persona que los proporcionó, siempre existe el riesgo de que se vuelvan a identificar.

IA predictiva

Más allá de los asistentes de IA generativos, las plataformas de redes sociales como Facebook, Instagram y TikTok recopilan continuamente datos sobre sus usuarios para entrenar modelos de IA predictivos. Cada publicación, foto, video, “me gusta”, publicación compartida y comentario, incluyendo el tiempo que las personas pasan viéndolos, se recopila como puntos de datos que se utilizan para crear perfiles digitales de cada persona que utiliza el servicio.

Los perfiles pueden utilizarse para refinar los sistemas de recomendación de IA de la plataforma. También pueden venderse a intermediarios de datos, quienes venden los datos de una persona a otras empresas para, por ejemplo, ayudar a desarrollar anuncios dirigidos a sus intereses.

Muchas empresas de redes sociales también rastrean a los usuarios en sitios web y aplicaciones mediante la instalación de cookies y píxeles de seguimiento integrados en sus ordenadores. Las cookies son pequeños archivos que almacenan información sobre quién eres y en qué has hecho clic mientras navegabas por un sitio web.

Uno de los usos más comunes de las cookies es en los carritos de compra digitales: cuando añades un artículo al carrito, abandonas el sitio web y vuelves más tarde, el artículo seguirá en el carrito porque la cookie ha almacenado esa información. Los píxeles de seguimiento son imágenes invisibles o fragmentos de código incrustados en sitios web que notifican a las empresas sobre tu actividad cuando visitas su página. Esto les ayuda a rastrear tu comportamiento en internet.

Por eso, los usuarios suelen ver o escuchar anuncios relacionados con sus hábitos de navegación y compra en muchos de los sitios web no relacionados que visitan, incluso cuando utilizan diferentes dispositivos, como ordenadores, teléfonos y altavoces inteligentes. Un estudio reveló que algunos sitios web pueden almacenar más de 300 cookies de seguimiento en tu ordenador o teléfono móvil.

Controles y limitaciones de la privacidad de datos

Al igual que las plataformas de IA generativa, las plataformas de redes sociales ofrecen configuraciones de privacidad y opciones de exclusión, pero estas otorgan a las personas un control limitado sobre cómo se agregan y monetizan sus datos personales. Como argumentó el teórico de medios Douglas Rushkoff en 2011, si el servicio es gratuito, tú eres el producto.

Muchas herramientas que incluyen IA no requieren que una persona realice ninguna acción directa para que la herramienta recopile datos sobre esa persona. Los dispositivos inteligentes, como altavoces domésticos, pulseras de actividad física y relojes, recopilan información continuamente mediante sensores biométricos, reconocimiento de voz y rastreo de ubicación. Los altavoces domésticos inteligentes escuchan constantemente la orden de activación o “despertar” el dispositivo. Mientras el dispositivo escucha esta palabra, capta todas las conversaciones que ocurren a su alrededor, aunque parezca no estar activo.

Algunas empresas afirman que los datos de voz solo se almacenan cuando se detecta la palabra de activación (lo que se dice para activar el dispositivo). Sin embargo, se ha expresado preocupación por las grabaciones accidentales, especialmente porque estos dispositivos suelen estar conectados a servicios en la nube que permiten almacenar, sincronizar y compartir datos de voz entre múltiples dispositivos, como el teléfono, el altavoz inteligente y la tableta.

Si la empresa lo permite, también es posible que terceros, como anunciantes, empresas de análisis de datos o una agencia del orden público con una orden judicial, accedan a estos datos.

Retrocesos en la privacidad

Esta posibilidad de acceso por parte de terceros también se aplica a los relojes inteligentes y monitores de actividad física, que monitorizan las métricas de salud y los patrones de actividad del usuario. Las empresas que producen dispositivos portátiles de actividad física no se consideran “entidades cubiertas” y, por lo tanto, no están sujetas a la Ley de Portabilidad y Responsabilidad de la Información Sanitaria (HIPPA). Esto significa que están legalmente autorizadas a vender los datos de salud y ubicación recopilados de sus usuarios. La preocupación por los datos de la HIPAA surgió en 2018, cuando Strava, una empresa de fitness, publicó un mapa de calor global con las rutas de ejercicio de sus usuarios. Al hacerlo, reveló accidentalmente ubicaciones militares sensibles en todo el mundo al destacar las rutas de ejercicio del personal militar.

La administración Trump ha contratado a Palantir, una empresa especializada en el uso de IA para el análisis de datos, para recopilar y analizar datos sobre los estadounidenses. Mientras tanto, Palantir ha anunciado una colaboración con una empresa que gestiona sistemas de autopago.

Estas colaboraciones pueden ampliar el alcance de las empresas y los gobiernos en el comportamiento cotidiano del consumidor. Esta podría utilizarse para crear perfiles personales detallados de los estadounidenses al vincular sus hábitos de consumo con otros datos personales. Esto genera preocupación por el aumento de la vigilancia y la pérdida de anonimato. Podría permitir que los ciudadanos sean rastreados y analizados en múltiples aspectos de sus vidas sin su conocimiento ni consentimiento.

Algunas empresas de dispositivos inteligentes también están reduciendo las protecciones de la privacidad en lugar de reforzarlas. Amazon anunció recientemente que, a partir del 28 de marzo, todas las grabaciones de voz de los dispositivos Amazon Echo se enviarán a la nube de Amazon de forma predeterminada, y los usuarios ya no podrán desactivar esta función. Esto difiere de la configuración anterior, que permitía limitar la recopilación de datos privados.

Cambios como estos generan preocupación sobre el control que tienen los consumidores sobre sus propios datos al usar dispositivos inteligentes. Muchos expertos en privacidad consideran el almacenamiento en la nube de grabaciones de voz como una forma de recopilación de datos, especialmente cuando se utiliza para mejorar algoritmos o crear perfiles de usuario, lo que tiene implicaciones para las leyes de privacidad de datos diseñadas para proteger la privacidad en línea.

Implicaciones para la privacidad de datos

Todo esto plantea serias preocupaciones sobre la privacidad de las personas y los gobiernos en cuanto a cómo las herramientas de IA recopilan, almacenan, utilizan y transmiten datos. La principal preocupación es la transparencia. Las personas desconocen qué datos se recopilan, cómo se utilizan ni quién tiene acceso a ellos.

Las empresas tienden a utilizar políticas de privacidad complejas y llenas de jerga técnica que dificultan la comprensión de los términos de un servicio que aceptan. Además, las personas tienden a no leer los documentos de términos de servicio. Un estudio reveló que las personas dedicaban un promedio de 73 segundos a leer un documento de términos de servicio con un tiempo de lectura promedio de 29 a 32 minutos.

Los datos recopilados por herramientas de IA pueden residir inicialmente en una empresa de confianza, pero pueden venderse y cederse fácilmente a una empresa que no es de confianza.

Las herramientas de IA, las empresas responsables de ellas y las empresas que tienen acceso a los datos que recopilan también pueden ser objeto de ciberataques y filtraciones de datos que pueden revelar información personal confidencial. Estos ataques pueden ser llevados a cabo por ciberdelincuentes que buscan el dinero, o por las llamadas amenazas persistentes avanzadas, que suelen ser atacantes patrocinados por países o estados que acceden a redes y sistemas y permanecen allí sin ser detectados, recopilando información y datos personales para, con el tiempo, causar interrupciones o daños.

Si bien leyes y regulaciones como el Reglamento General de Protección de Datos de la Unión Europea y la Ley de Privacidad del Consumidor de California tienen como objetivo proteger los datos de los usuarios, el desarrollo y el uso de la IA a menudo han superado el proceso legislativo. Las leyes aún se están poniendo al día en materia de IA y privacidad de datos. Por ahora, debe asumir que cualquier dispositivo o plataforma con IA recopila datos sobre sus entradas, comportamientos y patrones.

Uso de herramientas de IA

Si bien las herramientas de IA recopilan datos de las personas, y la forma en que esta acumulación afecta su privacidad es preocupante, también pueden ser útiles. Las aplicaciones con IA pueden optimizar flujos de trabajo, automatizar tareas repetitivas y proporcionar información valiosa.

Sin embargo, es fundamental abordar estas herramientas con precaución.

Al usar una plataforma de IA generativa que responde a las preguntas que escribes en un mensaje, no incluyas información personal identificable. Si pulsas Enter en el mensaje, perderás el control de esa información.

Recuerda que los dispositivos encendidos siempre están escuchando, incluso si están en reposo. Si usas dispositivos domésticos inteligentes o integrados, apágalos cuando necesites mantener una conversación privada. Un dispositivo en reposo parece inactivo, pero sigue encendido y a la espera de una palabra o señal de activación. Desenchufar un dispositivo o quitarle la batería es una buena manera de asegurarse de que esté realmente apagado.

Por último, ten en cuenta los términos de servicio y las políticas de recopilación de datos de los dispositivos y plataformas que utilizas. Podrías sorprenderte con lo que ya has aceptado.

Este artículo forma parte de una serie sobre privacidad de datos que explora quién recopila tus datos, qué y cómo recopilan, quién vende y compra tus datos, qué hacen con ellos y qué puedes hacer al respecto.

Christopher Ramezan es profesor adjunto de ciberseguridad en la Universidad de Virginia Occidental.

Este artículo se publicó originalmente en The Conversation bajo una licencia Creative Commons. Lee el artículo original.

Author

  • The Conversation

    Es una organización de noticias sin fines de lucro e independiente, dedicada a poner el conocimiento de los expertos al servicio del bien público.

    View all posts

Author

  • The Conversation

    Es una organización de noticias sin fines de lucro e independiente, dedicada a poner el conocimiento de los expertos al servicio del bien público.

    View all posts

Sobre el autor

Es una organización de noticias sin fines de lucro e independiente, dedicada a poner el conocimiento de los expertos al servicio del bien público.

ADVERTISEMENT

ADVERTISEMENT