
Durante los últimos años, la industria de la inteligencia artificial se ha obsesionado con el tamaño. Mientras más grande el modelo, más cosas puede hacer y más propiedades emergentes podría mostrar. Muchas de las funciones que hoy damos por sentadas —desde redactar textos, hasta generar ideas creativas— fueron propiedades emergentes que sorprendieron a desarrolladores e investigadores. Hoy, algunos de los modelos más recientes superan los dos billones de parámetros, lo que los vuelve increíblemente poderosos… e increíblemente costosos de desarrollar y operar.
Pero ahora hay un nuevo tipo de modelo que no está obsesionado con ser el más grande, sino con saber con seguridad lo que sabe (y lo que no). Te presento a los Small Language Models (SLM). A diferencia de los gigantes con los que interactuamos para casi todo, los SLM son más pequeños, afinados y entrenados para casos específicos: salud, finanzas, conocimiento interno de empresas, cadenas de suministro… lo que se te ocurra. ¿El detalle? Siempre hay uno. No son tan buenos para tareas generales, así que conviene mantener a la mano tu LLM favorito.
Tal vez en este punto te preguntes: “¿Y para qué querría yo una IA más pequeña que solo sea buena en una cosa?” Después de todo, tú eres de los que quiere el paquete completo, ¿no? Bueno, hay varias razones importantes para considerar esta nueva generación de modelos.
Lo bueno de ser chiquito
Primero, cuando se desarrollan correctamente, los SLM pueden superar a los LLM tradicionales en tareas especializadas. ¿Cómo? Con datos altamente curados y fine-tuning para tareas concretas. Al estar enfocados, libres de información irrelevante y de ruido, tienen menos margen para darte respuestas incorrectas. Y cuando se trata de tu trabajo, seguramente prefieras un sistema lleno de datos útiles para tu campo y no un LLM entrenado con una mezcla masiva de datos públicos y privados que poco tiene que ver con tu día a día.
Segundo, como con cualquier tecnología emergente, una vez que demostramos que algo funciona a gran escala, el siguiente paso natural es optimizarlo para que sea más eficiente, tanto en costos como en impacto ambiental. Una de las grandes ventajas de los SLM es que, por ser más pequeños, consumen menos recursos: menos cómputo, menos electricidad, menos agua. Para que te des una idea, una interacción con IA generativa en cualquier modelo popular puede consumir hasta 10 veces más energía que una búsqueda en Google y gastar alrededor de 50 ml de agua. Los SLM, en cambio, son más eficientes y operan dentro de márgenes más razonables.
Tercero, su naturaleza compacta les permite funcionar directamente en tu celular, laptop o tableta sin necesidad de enviar información a la nube. Tenerla en tu dispositivo significa mayor control y seguridad, para procesar datos sensibles sin exponerlos. Esta operación local —sin pasar por la nube— no solo amplía los entornos en los que puede usarse, sino que también refuerza la seguridad. Imagina trabajar con tu IA, de forma segura, en un vuelo, sin pagar (ni arriesgarte) al wifi del avión.
¿Listo para poner los SLM a prueba?
Cabe aclarar que los SLM todavía no son del todo comunes. Pero sé que mis lectores quieren estar un paso adelante, y todo apunta a que pronto veremos las primeras ofertas tanto para consumidores como para empresas. Si cuentas con un equipo interno de IA, pueden empezar hoy mismo… después de reenviar este artículo a tu CTO y colegas. Y si te preguntas cómo podrías aplicar estos modelos en tu organización, aquí van cuatro preguntas clave para ti y tu equipo:
- ¿Qué tipo de compromisos de privacidad hemos considerado en el uso de IA en nuestra organización?
- ¿Existe una necesidad clara de que nuestros equipos puedan acceder a la IA directamente desde sus dispositivos?
- ¿Tendría nuestra empresa una ventaja significativa si usamos una IA especializada, entrenada para casos de uso específicos en lugar de modelos más generales?
- ¿Tenemos un mandato interno o público relacionado con sostenibilidad?
Si respondiste que sí a alguna de estas preguntas, entonces tienes un motivo sólido para considerar que lo pequeño sea lo nuevo grande en tu empresa. Entonces, ¿es lo pequeño el nuevo grande? Depende. El cambio real no está en elegir entre lo grande y lo pequeño, sino en entender cuál sirve mejor a cada situación.
En los próximos años, las empresas que realmente prosperen serán aquellas que dejen de ver la IA como un bloque único y comiencen a verla como una caja de herramientas. De esta manera, podrán desplegar el modelo correcto, con la escala adecuada, para la tarea adecuada. Habrá casos en que un SLM especializado será la mejor opción para tu empresa o tu uso personal. La respuesta dependerá de la estrategia de IA que hayas definido y de cómo los SLM, LLM, la IA agéntica y otros tipos de IA se alineen con tus objetivos.
No te preocupes, mi próximo artículo cubrirá las mejores prácticas para diseñar tu estrategia de IA, porque el futuro de la IA no se definirá por su tamaño, sino por cómo encaje con tus objetivos. Y cuando lo haga de manera correcta, lo pequeño realmente podrá ser lo nuevo grande.