| Tech

Esta máquina potenciada por inteligencia artificial convierte fotos en olores

El Dispositivo Anemoia utiliza modelos de inteligencia artificial generativa para dar vida a los recuerdos

Esta máquina potenciada por inteligencia artificial convierte fotos en olores [Foto: Cyrus Clarke/MIT Media Lab]

Imagina un recuerdo de la infancia, uno que se sienta real y nostálgico, pero que de alguna manera se te escape: quizás un viaje familiar a la playa, un momento en pleno columpio en el parque infantil o una tarde buscando tréboles de cuatro hojas. Ahora, imagina que pudieras embotellar ese momento mágico en una fragancia. Un científico del MIT, Cyrus Clarke, está trabajando para lograr precisamente eso con ayuda de la inteligencia artificial.

Junto con un equipo de investigadores, Clarke ha desarrollado una máquina física llamada Dispositivo Anemoia, que utiliza un modelo de inteligencia artificial generativa para analizar una fotografía de archivo, describirla en una frase corta y, siguiendo las instrucciones del usuario, convertir esa descripción en una fragancia única.

La palabra “anemoia” fue acuñada por el autor John Koenig e incluida en su libro de 2021, The Dictionary of Obscure Sorrows. Se refiere a un sentimiento específico de nostalgia por un tiempo o lugar que uno nunca experimentó, y es exactamente lo que el equipo de Clarke espera capturar con el Dispositivo Anemoia.

Según un artículo publicado por el equipo, el dispositivo explora el concepto de “memoria extendida”, o la idea de que, en la era digital, la memoria se almacena y se accede cada vez más a través de medios externos, como archivos digitales.

Estudios ya han demostrado que la memoria puede formarse indirectamente —como cuando un relato de segunda mano, quizás de uno de los padres, moldea los propios recuerdos—, pero el Dispositivo Anemoia es un experimento interactivo, maravillosamente físico, sobre cómo la inteligencia artificial podría permitir a los usuarios experimentar el recuerdo de un pasado que nunca vivieron.

[Foto: Cyrus Clarke/cortesía del MIT Media Lab]

El Dispositivo Anemoia

El Dispositivo Anemoia parece algo que uno podría encontrar en la enfermería de una nave espacial retro de ciencia ficción. Es un delgado artilugio de metal y plástico, acentuado por una singular pantalla verde neón y un sencillo conjunto de tres diales físicos. En la parte inferior, un vaso de precipitados de vidrio espera para captar la fragancia final.

inteligencia artificial
[Foto: Cyrus Clarke/cortesía del MIT Media Lab]

Para empezar, el usuario inserta una fotografía en el dispositivo. Un modelo de visión-lenguaje (VLM) integrado analiza la imagen y genera un pie de foto inicial basado en lo que encuentra. Para una foto de turistas en China, un ejemplo utilizado en el artículo, el dispositivo podría escribir: “Un turista con pantalones cortos negros y un niño posan en la entrada de la Gran Muralla China, con los icónicos escalones de piedra y el paisaje montañoso que se extiende hacia el cielo”.

inteligencia artificial
[Foto: Cyrus Clarke/cortesía del MIT Media Lab]

Los usuarios pueden ajustar los parámetros del pie de foto con los tres diales: uno para decidir qué persona u objeto de la imagen debe ser el sujeto; otro para describir la edad del sujeto; y otro para describir el estado de ánimo de la escena.

inteligencia artificial
[Foto: Cyrus Clarke/cortesía del MIT Media Lab]

“Personalmente, estoy muy interesado en inventar nuevas interfaces físicas para la IA generativa”, afirma Clarke. La inteligencia artificial generativa suele comenzar con una consigna en blanco. Los diales la reemplazan con una gramática física y fácil de entender. No se trata de “decirle lo correcto” a un algoritmo; es más parecido a afinar un instrumento.

Un modelo de aprendizaje de idiomas, creado a partir de ChatGPT-4o, combina el texto original y las entradas del usuario en una narrativa breve y poética. Si se seleccionara la Gran Muralla China como tema de la consigna mencionada, el resultado sería algo así como: “Durante siglos, desde los Reinos Combatientes hasta la dinastía Ming, he observado con alegría el paso del tiempo y a innumerables viajeros a lo largo de mi camino de piedra, ladrillo y madera”.

A continuación viene la tarea más impresionante del LLM: convertir este poema escrito en un aroma tangible.

inteligencia artificial
[Foto: Cyrus Clarke/cortesía del MIT Media Lab]

El olfato como portal de la memoria

El proceso de desarrollo del aroma no solo se basa en identificar las notas olfativas adecuadas, sino también en evocar las emociones adecuadas.

El equipo de Clarke entrenó el modelo para seleccionar de una biblioteca de 39 fragancias diferentes (ampliada posteriormente a una cartera más amplia de 50), que abarca desde libros antiguos hasta cuero y tierra. Cada fragancia se codificó con un conjunto de descriptores, etiquetándolas con detalles como sus notas principales, conceptos asociados y emociones más intensas. El Modelo de Lenguaje Grande (LLM) utiliza su entrenamiento para seleccionar las fragancias adecuadas y determinar la cantidad de cada una que debe utilizarse en la mezcla final.

Toda esa información se canaliza a una pantalla olfativa personalizada, que utiliza cuatro bombas para extraer el líquido necesario de sus viales y depositarlo en el vaso de precipitados (la fórmula final de la fragancia de la Gran Muralla China incluye fogata, tierra, cedro y bambú). El dispositivo Anemoia es capaz de capturar una gama prácticamente infinita de fragancias, desde el aroma de una playa de arena en un caluroso día de verano de los años 80 hasta el aroma de una pareja disfrutando de una pera en un jardín pintoresco.

En última instancia, concluye el estudio, el dispositivo es una provocación que pregunta “qué significa recordar cuando la memoria en sí puede generarse, qué significa sentir cuando ese sentimiento está coescrito con una máquina y qué significa ser humano cuando podemos crear ficciones hermosas y fragantes de pasados ​​que nunca hemos vivido”.

Author

  • Grace Snelling

    Es colaboradora de Fast Company, con un enfoque en diseño de productos, branding, publicidad, arte y todo lo relacionado con la Generación Z. Sus artículos han incluido una exploración del excéntrico mundo del branding de agua, una charla con Questlove sobre su serie de YouTube centrada en la creatividad, y una mirada a la primera tienda física de Wayfair. Grace es una reciente graduada de la Universidad Northwestern, donde estudió periodismo y literatura inglesa. Antes de ser pasante y colaboradora en Fast Company, trabajó como freelance en la revista St. Louis durante dos años, cubriendo el crecimiento de la escena local de arte y cultura.

    View all posts

Author

  • Grace Snelling

    Es colaboradora de Fast Company, con un enfoque en diseño de productos, branding, publicidad, arte y todo lo relacionado con la Generación Z. Sus artículos han incluido una exploración del excéntrico mundo del branding de agua, una charla con Questlove sobre su serie de YouTube centrada en la creatividad, y una mirada a la primera tienda física de Wayfair. Grace es una reciente graduada de la Universidad Northwestern, donde estudió periodismo y literatura inglesa. Antes de ser pasante y colaboradora en Fast Company, trabajó como freelance en la revista St. Louis durante dos años, cubriendo el crecimiento de la escena local de arte y cultura.

    View all posts

Sobre el autor

Es colaboradora de Fast Company, con un enfoque en diseño de productos, branding, publicidad, arte y todo lo relacionado con la Generación Z. Sus artículos han incluido una exploración del excéntrico mundo del branding de agua, una charla con Questlove sobre su serie de YouTube centrada en la creatividad, y una mirada a la primera tienda física de Wayfair. Grace es una reciente graduada de la Universidad Northwestern, donde estudió periodismo y literatura inglesa. Antes de ser pasante y colaboradora en Fast Company, trabajó como freelance en la revista St. Louis durante dos años, cubriendo el crecimiento de la escena local de arte y cultura.