| Design

OpenAI podría cambiar el diseño de apps para siempre

Con la nueva tienda de aplicaciones de OpenAI ahora abierta, ejecutivos de diseño de Canva, Figma, Adobe y Target explican sus primeras integraciones en ChatGPT y responden la pregunta: ¿Qué es realmente una app cuando forma parte de una conversación con IA?

OpenAI podría cambiar el diseño de apps para siempre [Collage: Fast Company]

Cuando Apple lanzó la App Store en 2008, su influencia en el futuro de internet fue imposible de dimensionar. El todopoderoso internet fue dividido en pequeñas aplicaciones a menudo llamadas Web 2.0. Lo que siguió no fue solo software que cabía en tu bolsillo. Desde TikTok hasta Uber, estas plataformas con cámara, GPS integrado y conectadas a la nube cambiaron nuestra forma de vivir.

Ahora, tras la llegada de la IA, la tienda de aplicaciones resurge. Pero en lugar de construirse como íconos en los que puedes tocar dentro de un sistema operativo móvil, se están conectando directamente a las conversaciones de modelos de lenguaje grandes (LLMs] como Microsoft CoPilot y Claude de Anthropic.

Hoy, OpenAI –la plataforma de IA más grande con 800 millones de usuarios semanales– abre ChatGPT para que cualquier desarrollador integre su app directamente en el flujo de conversación (pendiente de revisión y aprobación). Tras un piloto a principios de año, ahora cualquier desarrollador puede conectar sus propias aplicaciones para que sean sugeridas contextualmente durante cualquier chat, o invocadas por un usuario al mencionarlas con @.

[Imagen: Adobe]

Socios iniciales como Adobe te permitirán editar imágenes en plena conversación (con controles deslizantes para ajustarlas), mientras que Target mostrará cualquier tipo de producto para comprar. Sin importar tu opinión sobre la IA, estas herramientas parecen destinadas a cambiar nuestra forma de pensar sobre las apps e incluso la multitarea, al cambiar de un software basado en sustantivos (Canva, Figma) a verbos (“crear una presentación”).

“Ya no se sentirá como entrar por una puerta principal. Estás conociendo a estos [usuarios] en un momento muy específico”, dice Bryant Jow, diseñador de OpenAI que supervisa la integración de apps. “Realmente creo que una de las cosas más importantes es que no debe sentirse como si hubiera una curva de aprendizaje o que tengas que reorientarte. Simplemente debería sentirse inmediata e instantáneamente intuitivo”.

[Image: Canva]

De hecho, la promesa de todas las empresas asociadas con las que hablé es cumplir lo que los modelos de lenguaje generalmente solo insinúan. Generamos todo tipo de ideas dentro de los chats de IA, pero cuando llega el momento de darles vida, podemos toparnos con un muro. Aquí es donde las aplicaciones integradas pueden aparecer, ofreciendo sus servicios más refinados. Pero el diablo está en los detalles. Y muy pocos detalles se han resuelto completamente.

“Si recuerdas las primeras apps que la gente hizo en la App Store, como la aplicación de beber cerveza [iBeer], eran como, lo que fuera, ¿verdad? Mucha gente tardó un momento en descubrir cómo comportarnos en este ecosistema. ¿Qué construimos? ¿Cómo proporcionamos utilidad? ¿Y cómo optimizamos para eso?”, dice Gui Seiz, quien lidera el diseño de producto en el equipo de IA de Figma. “Creo que todavía estamos en esa etapa”.

[Imagen: Figma]

QUÉ PUEDEN HACER REALMENTE LAS APPS DE CHATGPT Y CÓMO LO HACEN

Para ser completamente franco, los proveedores de modelos de IA están creando algo así como un uróboros con aplicaciones conectadas. Hablas con ChatGPT. Te recomienda conectarte con una app. Sin embargo, esa app probablemente esté impulsada por modelos de IA que podrían ser de OpenAI. Y entonces su agente parcialmente impulsado por OpenAI, lleno de conocimiento especializado, vuelve a aparecer en la plataforma ChatGPT de OpenAI. Es nuestro futuro de agentes hablando con agentes, sucediendo ahora.

Sin embargo, la salsa secreta de estas conexiones no es simplemente la típica pila de APIs que se han usado para conectar aplicaciones durante años. Es un nuevo estándar de rápido crecimiento llamado MCP (Protocolo de Contexto de Modelo). Originalmente desarrollado por Anthropic en 2024, ahora es de código abierto bajo Linux.

Cuando una empresa ejecuta un servidor MCP, esencialmente está abriendo una puerta para hacer que todo lo que quiere sea comprensible para la IA –compartiendo datos, herramientas y memoria– todo en un proceso consolidado y automatizado. Mientras que las empresas de modelos originalmente se abrieron paso por internet a la fuerza, destrozando y agarrando los conjuntos de datos necesarios para construir sus sistemas, MCP es el equivalente de un mayordomo pidiéndoles que se limpien los pies y dándoles la bienvenida a la IA.

Para Target, MCP significó que su lanzamiento inicial en ChatGPT sucedió rápido: apenas cuatro semanas desde que comenzaron las discusiones con OpenAI y Target ya estaba vendiendo en su plataforma.

[Imagen: Target]

¿Pero cómo es comprar en Target a través de un LLM? Por el momento, puedes escribir @target y pedir comprar, en mi caso, “ofertas de Lego para navidad”. Genera una cuadrícula de miniaturas con opciones, todas con precios. Toca una y te llevan a una nueva página con más información, justo como si estuvieras en su sitio web. Ahí puedes agregarla a tu carrito. Target, como todos los socios con los que hablé, promete que llegarán más funciones rápidamente, más a escala de semanas que de meses.

Tanto Canva como Figma han ofrecido herramientas para crear presentaciones de diapositivas, convirtiendo una lluvia de ideas o prácticamente cualquier cosa que quieras pegar en ChatGPT en una presentación. Ambos servicios están aprovechando sus propias plantillas para construir activos visuales que se previsualizan como miniaturas. Desde ahí, puedes tocar cualquier vista previa para ver toda la presentación. El problema es que, en cualquier caso, realmente no puedes editar estas diapositivas más a través de la conversación: la integración de la app te devuelve al ChatGPT estándar después de la consulta. En su lugar, la vista previa, como en Target, te remite de vuelta a sus respectivas apps.

[Imagen: Figma]

Por eso la integración más ambiciosa parece ser la de Adobe, que integró herramientas de Adobe Express, Photoshop y Acrobat. Adobe realmente construyó su propia experiencia de interfaz ligera dentro de ChatGPT, así que si le pides que aclare una foto, aparecerán algunos controles deslizantes en la pantalla que solo controlan los niveles de exposición y blanco y negro. De esa manera puedes obtener la imagen exactamente tan brillante como quieras, en lugar de decirle a la IA, “un poco más brillante, espera, no, un poco más oscuro”.

Esta interfaz es intencionalmente granular, construida para mostrar solo lo que necesitas para una tarea y nada más.

“Eso es lo que hace esto increíblemente emocionante”, argumenta Govind Balakrishan, SVP y gerente general de Adobe Express. “Ya no estás lidiando con la totalidad de la interfaz de Photoshop. Solo estás lidiando con esos controles deslizantes que te dan lo que estás tratando de hacer”.

DESCUBRIR NUEVAS APPS SERÁ EL NUEVO SEO

Sin embargo, la capacidad de descubrir aplicaciones aún necesita trabajo. Y esto representa tanto un desafío a corto como a largo plazo para la empresa.

A corto plazo, el descubrimiento conversacional simplemente apesta.

Para ser honesto, invocar estas aplicaciones puede ser frustrante y problemático. OpenAI también necesita hacer trabajo de limpieza en su interfaz, agregando las comodidades que esperamos. Por ejemplo, cuando mencionas con @ cualquier aplicación disponible, se completa automáticamente como un nombre de usuario de Instagram, pero solo después de que hayas emparejado la aplicación exitosamente una vez. En el caso de Adobe, esto se vuelve especialmente complicado, ya que invocas funciones específicas a través de sus aplicaciones separadas como @Photoshop y @AdobeAcrobat (y no pidas crear un PDF en Photoshop). Eso es innecesariamente desordenado y debería ser resuelto por el modelo de lenguaje, no por el usuario.

[Imagen: Adobe]

Mientras tanto, ni siquiera se supone que debas estar obligado a llamar aplicaciones todo el tiempo, ya que se supone que el modelo de lenguaje las sugiera casualmente en lo que la empresa llama “invocación indirecta”. No estoy viendo mucho, si es que algo, de que eso esté funcionando todavía.

Cuando soy demasiado casual, diciendo “me gustaría comprar en Target” en lugar de “@target encuéntrame X”, listó tiendas Target cercanas y luego me ofreció consejos de compra. Cuando dije que “esperaba trabajar con la app de Target en ChatGPT ahora mismo”, explicó que podía hacerlo, junto con todo lo que podía hacer en Target. Pero siempre dependía de mí invocar el código secreto mencionado: @Target en este caso, para hacer mi consulta.

Es una funcionalidad suficientemente fácil que la gente aprenderá y que no es diferente a usar X o Threads, pero todo el punto de una interfaz conversacional amigable es que no sea un bar clandestino. Me sorprendió continuamente la falta de comprensión contextual (y OpenAI dice que actualmente no están activos para todos los usuarios).

Pero esto se siente rápidamente solucionable.

[Imagen: Canva]

La pregunta existencial mayor para OpenAI es cómo y por qué recomendaría una aplicación sobre otra que ofrece características similares con calidad similar.

No nos equivoquemos, cada empresa quiere ser la aplicación que se invoca a petición. Yo mismo me preguntaba por qué algunas empresas se molestarían en conectarse a ChatGPT. Tan pronto como entregan sus capacidades a una IA generalizada, ¿no están diluyendo su propio valor? Target gana dinero con cada venta, claro, y Canva todavía ofrece cuidadosamente sus artículos gratuitos gratis y sus artículos pagos por suscripción. Pero Adobe, por ejemplo, está ofreciendo todas sus herramientas de ChatGPT gratis en lugar de venderte una suscripción.

“En cierto nivel, creemos que cuantos más usuarios tengamos… aprovechando la amplitud y fortaleza de nuestras aplicaciones, mejor estaremos con el tiempo”, dice Balakrishan. “La monetización se resolverá de alguna manera”.

Por ahora, ayuda que todos estos servicios de generación de medios te vinculen de vuelta a sus respectivas aplicaciones, con interfaces completas, para terminar el trabajo que solo puedes comenzar en ChatGPT. De hecho, Canva compartió datos tempranos de ejecutar sus propios servidores MCP para atender solicitudes de Claude, CoPilot y ChatGPT desde julio. Han servido a 2.6 millones de usuarios que han creado más de 11 millones de diseños, y ha estado funcionando como una herramienta para atraer atención. Canva señala que el tráfico de referencia de los modelos de lenguaje está creciendo a un ritmo más rápido que cualquier otra fuente.

Pero en el panorama general, todos parecen estar de acuerdo en que integrar aplicaciones en modelos de lenguaje debe ser más que simplemente portar una aplicación a una interfaz de chat. Debería desbloquear nuevos flujos de trabajo, funciones e interfaces que aún no hemos imaginado.

“Hay algunas cosas que, por cualquier razón, la modalidad que ofrece Figma no es ideal para hacer esa cosa específica”, dice Seiz. “Me pregunto qué tipo de nuevos casos de uso o nuevas cosas la gente va a estar tratando de hacer”.

[Imagen: Figma]

ENCONTRAR LA PRÓXIMA GRAN MODALIDAD DE IA

Para Target, que se lanzó justo a tiempo para el Black Friday, una de sus mayores sorpresas fue un nuevo comportamiento de compra. La gente subió listas escritas a mano en lugar de escribirlas. Eso fue interesante, y Target no sabe qué es posible a partir de eso todavía, pero es uno de muchos puntos de datos que podrían informar su pensamiento futuro.

“Queríamos entra temprano y tener un rol en cómo evoluciona ese camino”, dice Purvi Shah, vicepresidenta de diseño UX, investigación y accesibilidad en Target.

[Imagen: Target]

La mayor preocupación para las empresas con las que hablé no era si serían mercantilizadas al conectarse a una vasta plataforma de IA, sino cómo serían descubiertas en todo ese ruido. No es secreto que Adobe, Canva y Figma son competidores entre sí, al igual que Target y Walmart (que también fue de las primeras en integrar compras con ChatGPT). Sugerir cualquiera de ellas contextualmente, en conversación, significa que OpenAI necesita tomar una decisión sobre qué servicio competidor es el correcto para cualquier momento dado. Naturalmente, todos quieren apropiarse de ese momento.

Cuando le pregunto a OpenAI cómo manejarán este problema, Jow admite que es “definitivamente uno de los desafíos más difíciles” que enfrenta el equipo. Cuando pregunto si veremos colocación pagada, como los anuncios de búsqueda que han impulsado el negocio de Google durante años, dice: “Ya veremos”.

Mientras tanto, los desarrolladores de apps compartieron su propio nerviosismo sobre cómo se desarrollará esto, y están de acuerdo en que probablemente veremos una era de optimización de plataformas de IA –muy similar a como los sitios clásicamente se optimizaban para ser descubiertos por Google– para llegar a la cima de ChatGPT y otros modelos de lenguaje. Por ahora, todo lo que los desarrolladores pueden hacer es servir respuestas “de calidad y relevantes” a cualquier solicitud, según Seiz, para que OpenAI esté incentivado a seguir recomendando el servicio de uno.

“Ciertamente es inevitable que habrá múltiples experiencias adyacentes que ofrecen una herramienta realmente genial para ese caso de uso”, dice Jow. “Y creo que lo que realmente queremos asegurar es que esas opciones se muestren al usuario de una manera muy transparente, para que el usuario pueda decidir qué herramienta es más adecuada para ellos”.

La fecha límite extendida para los premios World Changing Ideas de Fast Company es el viernes 19 de diciembre a las 11:59 p.m. PT. Aplica hoy.

Author

  • Mark Wilson

    Mark Wilson es el Editor Global de Diseño en Fast Company. Ha escrito sobre diseño, tecnología y cultura durante casi 15 años. Su trabajo sido publicado en GQ, Esquire, PopMech, PopSci, American Photo y Lucky Peach.

    View all posts

Author

  • Mark Wilson

    Mark Wilson es el Editor Global de Diseño en Fast Company. Ha escrito sobre diseño, tecnología y cultura durante casi 15 años. Su trabajo sido publicado en GQ, Esquire, PopMech, PopSci, American Photo y Lucky Peach.

    View all posts

Sobre el autor

Mark Wilson es el Editor Global de Diseño en Fast Company. Ha escrito sobre diseño, tecnología y cultura durante casi 15 años. Su trabajo sido publicado en GQ, Esquire, PopMech, PopSci, American Photo y Lucky Peach.