Meta, la empresa matriz de Facebook, WhatsApp e Instagram, presentó la semana pasada la última versión de Llama, su familia de grandes modelos de lenguaje (LLM) de código abierto.
Según la compañía, Llama 3.1 es el primer “frontier model” de código abierto, una afirmación que implica que se encuentra en el pináculo de las capacidades actuales de IA.
Llama 3.1 está disponible en varios tamaños, y el modelo más grande, “405B”, cuenta con 405 mil millones de parámetros neuronales, superando a otros modelos de código abierto líderes como Mixtral y Google Gemma 2.
Al ser de código abierto, cualquiera puede entrenar y ejecutar Llama 3.1 en sus propios ordenadores, siempre que sean extremadamente potentes. Exploremos juntos cómo este nuevo modelo de Meta puede transformar el panorama actual de la IA.
El avance de Llama 3.1
Los modelos de la familia Llama 3.1 destacan por su tamaño y capacidades excepcionales. El modelo insignia, con 405 mil millones de parámetros, está diseñado para superar los límites del rendimiento y la usabilidad de la IA.
Mark Zuckerberg, CEO de Meta, ha expresado en una carta su creencia de que los modelos “abiertos” son el futuro. Por ello, el enfoque de Meta con Llama 3.1 enfatiza la apertura, a diferencia de modelos “cerrados” como GPT-4, Gemini 1.5 o Claude 3.5 Sonnet.
Aunque Meta describe Llama 3.1 como de código abierto, algunos expertos debaten esta afirmación. Según Bradley Shimmin, analista de la industria en Omdia, los modelos de Llama no son verdaderamente de código abierto según la definición de la Open Source Initiative.
Un término más preciso sería decir que Llama 3.1 tiene los “pesos” o parámetros abiertos. Esto significa que se pueden ajustar y entrenar estos modelos, aunque Meta no ofrece transparencia completa sobre los datos utilizados para pre-entrenar los modelos.
El lanzamiento también incluye variantes más pequeñas, como 70B y 8B, que se adaptan a diferentes casos de uso y recursos computacionales.
¿Qué necesito para ejecutar Llama 3.1?
Para ejecutar el modelo más grande, Llama 3.1-405B, se requiere una infraestructura computacional extremadamente potente. En específicos necesitarías al menos dos servidores Nvidia H100, que combinan un total de 16 GPUs, 1 TB de RAM y 870 GB de VRAM.
Para utilizar Llama 3.1-405B en aplicaciones prácticas, lo más sensato es utilizar la infraestructura en la nube proporcionada por servicios como AWS, Microsoft Azure o Nvidia DGX Cloud. Esto facilita su implementación sin necesidad de poseer el hardware necesario.
Las versiones más pequeñas y menos potentes de Llama 3.1 tienen necesidades de hardware más modestas. Por ejemplo, Llama 3.1 8B “solo” necesitarías unos 16 GB de VRAM, haciendo posible ejecutarlo en un sistema con una Nvidia 4090.
El costo anual para ejecutar el modelo Llama 3.1-405B en una infraestructura adecuada puede superar los 300.000 euros, lo que hace que sea accesible principalmente para grandes empresas con presupuestos significativos para investigación y desarrollo en IA.
Para mitigar los altos costos de ejecutar el modelo 405B, se espera que las empresas recurran a los servicios en la nube.
Meta ha establecido asociaciones con una amplia gama de empresas, incluidas AWS, Google Cloud, Microsoft Azure e IBM watsonx, para proporcionar los modelos Llama 3.1 a través de APIs. Este enfoque permite a las empresas acceder a los recursos informáticos necesarios en función de sus necesidades, reduciendo las inversiones iniciales.
Ventajas clave de Llama 3.1 para las empresas
Una de las ventajas más significativas de Llama 3.1 para las empresas es la capacidad de personalizar los modelos para casos de uso específicos sin incurrir en altos costos.
Según Paul Nashawaty, analista principal de The Futurum Group, proporcionar un modelo de lenguaje con pesos abiertos permite a las empresas construir soluciones de IA personalizadas sin tener que pagar costosas licencias.
Rendimiento comparable a los modelos más avanzados
La familia Llama 3.1, en particular el modelo 405B, ha demostrado un rendimiento competitivo en pruebas de referencia contra modelos propietarios líderes como GPT-4o de OpenAI y Gemini 1.5 de Google.
La publicación del blog de Meta destaca que el modelo 405B superó o igualó a estos modelos en pruebas como MMLU, MATH, GSM8K y ARC Challenge, que evalúan la inteligencia general, las matemáticas y las capacidades de razonamiento.
Seguridad y privacidad en los datos
Arnal Dayaratna, vicepresidente de investigación de IDC, señala que las empresas pueden ajustar los modelos Llama 3.1 utilizando sus propios datos sin tener que compartir datos con un proveedor externo.
Esta capacidad ayuda a evitar un problema cada vez más común con los LLMs propietarios; depender y quedar atrapado por un solo proveedor de IA.
¿Cómo responderá la competencia a Llama 3.1?
El lanzamiento de Llama 3.1 representa un desafío significativo para los proveedores de LLMs propietarios. Los analistas predicen que la apertura y el alto rendimiento de los modelos de Meta podrían perturbar el mercado.
Tobias Zwingmann, socio gerente de Rapyd.AI, sugiere que la disponibilidad de modelos abiertos como Llama 3.1 podría llevar a las empresas a reducir su dependencia de los LLMs propietarios cerrados.
Este cambio podría interrumpir a las empresas y proveedores que construyen y venden modelos propietarios.
La competencia ya está respondiendo al movimiento de Meta. Dentro de las 24 horas posteriores al lanzamiento de Llama 3.1, OpenAI anunció un nivel gratuito para personalizar su modelo GPT-4o mini.
Esta reacción indica una tendencia más amplia hacia la reducción de costos y el aumento de la accesibilidad para mantenerse competitivos.
¿Está disponible Llama 3.1 en la Unión Europea?
Llama 3.1 está disponible globalmente, sin restricciones geográficas, pero solo puede usarse a través de algún proveedor de Cloud Computing o ejecutándolo localmente. Sin embargo, aún no está disponible desde la interfaz multimodal Meta.AI en la Unión Europea y otros países.
Meta percibe el entorno regulatorio en la UE como impredecible, lo que añade una capa de incertidumbre a la hora de implementar nuevas tecnologías.
Por esta razón, la empresa matriz de Facebook e Instagram ha decidido no lanzar su modelo multimodal Llama 3.1 en el bloque europeo debido a las estrictas y a veces impredecibles regulaciones del GDPR (Reglamento General de Protección de Datos).
El futuro de los LLMs abiertos
Llama 3.1 de Meta representa un hito significativo en el desarrollo de modelos de lenguaje grandes. Su apertura, rendimiento y flexibilidad ofrecen beneficios sustanciales a las empresas, al tiempo que desafían el dominio de los proveedores de modelos propietarios.
A medida que el panorama de la IA evoluciona, se espera que el lanzamiento de Llama 3.1 impulse una mayor competencia, innovación y adopción de modelos de IA abiertos.
Para las empresas, la capacidad de aprovechar soluciones de IA poderosas y personalizables sin incurrir en altos costos marca una nueva era de posibilidades en la inteligencia artificial.