
La industria tecnológica lleva mucho tiempo obsesionada con las metáforas relacionadas con la carrera espacial original. Su favorita es la de “lanzamiento a la Luna” (o “moonshot”), término que aplica a cualquier empresa de ambición atípica. Pero el lanzamiento por parte de la startup china DeepSeek de un modelo de inteligencia artificial que puede competir con GPT-o1 de OpenAI (a pesar de haber sido creado a bajo costo, sin acceso a los mejores chips de Nvidia) ha hecho que todos se remonten al momento original del Sputnik de 1957 como punto de comparación.
De alguna manera, a la mayoría de la gente le llevó una semana prestar atención al R1 de DeepSeek, que la empresa lanzó el 20 de enero. Una vez que lo hicieron, generó un frenesí instantáneo cuyas ondas de choque abarcaron desde lo tecnológico hasta lo geopolítico.
Entre ellos, cabe citar pérdidas de ganancias en el mercado de valores para Nvidia y otros fabricantes de chips, nuevas preguntas sobre si los vastos recursos realmente proporcionan una ventaja en IA después de todo y la sorpresa de que las restricciones de la administración Biden de enviar los chips más potentes diseñados en Estados Unidos a China no impidieron que los investigadores de ese país hicieran un avance que podría cambiar una época con el material que tenían a mano.
Paralelismos con la carrera espacial
El impacto abrupto de DeepSeek tiene similitudes innegables con el pánico desatado hace más de 67 años cuando la URSS puso con éxito un satélite en órbita antes que Estados Unidos. Pero como señaló el exdirector ejecutivo de Reddit Yishan Wong en una publicación esta semana, los paralelismos son superficiales. Por un lado, los soviéticos trabajaron en un profundo secreto.
Por el contrario, DeepSeek está publicando código e investigación relacionados con sus técnicas para crear IA que haga más con menos. Eso le da al mundo entero la oportunidad de desarrollar rápidamente lo que la empresa ha creado, acelerando potencialmente el uso de la IA en todas partes en lugar de preservar una ventaja competitiva abrumadora para una empresa o un país.
Sin duda, la repentina mercantilización de la IA podría tener profundas implicaciones para el puñado de poderosas empresas estadounidenses que hasta ahora han impulsado la tecnología. Pero, si bien los detalles y el momento de ese punto de inflexión eran impredecibles, su inevitabilidad no lo era.
Por ejemplo, un documento interno de Google filtrado a principios de 2023 se titulaba “No tenemos una ventaja competitiva, y OpenAI tampoco”. O, como dijo el CEO de Microsoft, Satya Nadella, cuando hablé con él más tarde ese año: “En lo que a mí respecta, los primeros avances en tecnología no importan”.
Los gigantes tecnológicos tienen mucho trabajo por hacer
La R1 de DeepSeek (y otras tecnologías de IA basadas en su enfoque) bien pueden obligar a los gigantes actuales de la IA a reevaluar todo lo relacionado con su futuro. Sin embargo, eso no es un fin para la industria tal como la conocemos.
La inteligencia artificial no está ni cerca de chocar contra un muro infranqueable que impida un mayor progreso, y es difícil imaginar que las empresas con acceso a vastos recursos no puedan desbloquear algunos avances que las que operan bajo mayores restricciones no pueden.
Lo más importante es que las vertiginosas mejoras que hemos visto en los LLM en los últimos años aún no han sido igualadas por la IA del mundo real en las aplicaciones que utilizamos. A medida que la novedad de la IA generativa se desvanece, herramientas como Copilot de Microsoft parecen borradores cada vez más toscos de algo que necesita más ingenio para estar a la altura de su potencial. El trabajo de conectar la IA a todos los procesos que utilizamos para hacer las cosas apenas ha comenzado, y las empresas que lo hagan pueden ganar mucho dinero.
Ese es el hecho subyacente detrás de la obsesión de la industria con la llamada IA agéntica, una palabra de moda ligeramente molesta que engloba formas de la tecnología que pueden realizar tareas complejas sin una supervisión humana constante. Hay algunos intentos iniciales decentes de aplicar esta idea, como los “compañeros de equipo de IA” de Asana, que ya se hacen cargo de parte del trabajo pesado de gestionar tareas en la aplicación de gestión de proyectos. Pero esos ejemplos se ven superados en número por los casos de IA con agentes que, en su mayoría, demuestran que la tecnología no está lista para hacer mucho por sí sola.
La semana pasada, por ejemplo, OpenAI lanzó Operator, una “vista previa de investigación” disponible para los usuarios de su nivel ChatGPT Pro de 200 dólares al mes. Operator puede escribir en un navegador web y controlar el puntero del ratón, un primer paso teórico para permitirle gestionar todas las tareas que los humanos realizamos en la web.
En Platformer, Casey Newton informó sobre su experiencia práctica con el servicio, que incluyó pedirle que realizara tareas como escribir un plan de clase de secundaria para El gran Gatsby. Tomó minutos lograr resultados que no fueron mejores que los que ChatGPT produjo casi instantáneamente. Y cuando Newton intentó usar Operator para pedir comida (algo que un chatbot normal no puede hacer), resultó que la versión actual de Operator también es bastante inútil para esa tarea.
En diciembre, recibí una demostración de la IA agéntica experimental de Google, “Project Mariner”, que también implicaba pedir comida y era demasiado lenta como para parecer un progreso. El hecho de que Operator y Mariner aún no estén listos para manejar una tarea humilde como comprar un galón de leche no es evidencia de que sean ejercicios inútiles, solo que el objetivo de hacer que la IA sea útil y agéntica sigue siendo en gran medida una aspiración.