En el acelerado mundo de la inteligencia artificial, las organizaciones se enfrentan a una disyuntiva: adoptar soluciones de IA que sean seguras, eficientes y que se ajusten a sus necesidades concretas. En este contexto, los Modelos de Lenguaje Pequeños (SLM) emergen como una alternativa estratégica frente a los Grandes Modelos de Lenguaje (LLM), como ChatGPT, Copilot y Gemini.
Mientras que los LLM están diseñados para abordar una amplia gama de tareas, desde responder preguntas generales hasta redactar textos complejos, los SLM ofrecen una propuesta más acotada, pero también más precisa. Estos modelos se especializan en temáticas concretas, consumen menos recursos y pueden desplegarse dentro de los centros de datos corporativos, lo que no solo reduce costos, sino que también mejora la gobernanza sobre los datos sensibles del negocio.
La Eficiencia de los Modelos de Lenguaje Pequeños
Este enfoque más eficiente responde a una limitación clave: la capacidad de cómputo. Dado que esta es limitada, hoy se necesitan modelos que no consuman tantos recursos. Además, cuando se quiere hacer una implementación en una compañía, no es necesario que el modelo sepa quién es el último presidente o que sea experto en biología; lo que se precisa es que maneje los datos de la empresa, para lo cual se debe hacer un entrenamiento o un alineamiento específico.
Mientras que los LLM hacen de todo, los SLM se enfocan en pocas cosas, pero las hacen muy bien, con más precisión y (en general) sin las famosas «alucinaciones».
Y también con un costo menor, especialmente cuando se piensa en su utilización a gran escala dentro de las organizaciones.
La Expansión del Mercado de Modelos de Lenguaje Pequeños
Según un informe de Markets and Markets, el mercado mundial de modelos de lenguaje pequeño (SLM) está a punto de experimentar una expansión sustancial, con una tasa de crecimiento anual compuesta (TCAC) del 28,7 % entre 2025 y 2032. En 2025, este mercado se valoró en aproximadamente U$S 930 millones, y se espera que alcance los U$S 5450 millones en 2032.
Como se entrenan con conjuntos de datos más acotados y seleccionados, estos modelos resultan más relevantes para las compañías. Al ser más livianos, también pueden ser entrenados más fácilmente con los datos propios de la empresa, incluyendo su contexto de negocio, lo que les permite responder de forma más eficaz a preguntas específicas. Y, al poder ejecutarse dentro de los data centers de las organizaciones, refuerzan la seguridad y reducen costos.
La Estrategia de IA Basada en Soberanía de Datos
Si bien los LLM suelen estar disponibles como servicio en la nube pública y son fáciles de comenzar a utilizar, cuando se trata de inteligencia artificial generativa, muchas veces se trabaja con datos sensibles del negocio, y las empresas se muestran reticentes a perder el control sobre esa información. Por eso, hoy empiezan a definir su estrategia de IA no solo en términos de adopción, sino también de soberanía sobre los datos y sobre la infraestructura tecnológica.
A futuro, LLM y SLM van a coexistir. Los primeros serán más utilizados por personas en su vida cotidiana, mientras que los segundos tendrán un rol clave dentro de las empresas. Estas no dependerán de un único modelo, sino de un conjunto diverso que dé soporte a diferentes áreas del negocio, como un modelo experto en temas legales, otro que actúe como guardián ético, y uno más que se enfoque en contabilidad.
Democratizando el Acceso a la IA Generativa
Herramientas como InstructLab, una herramienta open source que simplifica el entrenamiento de modelos y la incorporación de inteligencia, y tecnologías como vLLM de Neural Magic, que permiten comprimir modelos y ejecutarlos de forma más rápida y eficiente, amplían el acceso al mundo de la IA para muchas más organizaciones.
Dentro de este emergente ecosistema de SLM, el modelo open source ofrece ventajas claras: libertad para elegir tecnologías sin quedar atado a proveedores, la posibilidad de que todos colaboren para innovar, y, sobre todo, el objetivo de democratizar el acceso a la inteligencia artificial.