Llama 4 Meta IA 2173579488

Meta presenta Llama 4, su nueva familia de modelos de IA

Meta anunció el lanzamiento de Llama 4, una nueva colección de modelos de inteligencia artificial (IA) que promete capacidades equiparables a las de GPT-4o, de OpenAI, Gemini 2.0 Flash, de Google, y DeepSeek-V3. Estos nuevos algoritmos se destacan por ser multimodales y contar con ventanas de contexto de gran escala, que van desde 1 millón hasta 2 billones de tokens.

 

El primer modelo presentado es Llama 4 Scout. Según Meta, “es el mejor modelo multimodal del mundo en su categoría y supera a todas las generaciones anteriores de Llama”. Su arquitectura está compuesta por 17,000 millones de parámetros activos, una ventana de contexto de 10 millones de tokens (equivalente a unas 15,000 páginas de texto) y un sistema basado en “mezcla de expertos”, que integra 16 submodelos especializados en diversas tareas, temáticas y formatos multimedia que se activan según las solicitudes del usuario.

 

Este diseño permite ejecutar el modelo en una sola unidad de procesamiento gráfico (GPU) Nvidia H100, lo cual optimiza su rendimiento y disminuye el consumo de recursos computacionales. De acuerdo con los desarrolladores, Llama 4 Scout supera a Gemma 3, Gemini 2.0 Flash-Lite y Mistral 3.1 en tareas como el análisis profundo de datos, revisiones extensas de código, generación de resúmenes complejos y evaluación legal de documentos extensos.

 

Por su parte, Llama 4 Maverick es el primer modelo de la serie que incorpora capacidades multimodales de manera nativa, es decir, ha sido entrenado simultáneamente con texto, imágenes y video sin necesidad de etiquetado previo. Su estructura cuenta con 128 expertos, lo que le permite alcanzar un total de 400,000 millones de parámetros, manteniendo activos 17,000 millones por token. Esto lo posiciona como un competidor de alto nivel, capaz de igualar los resultados de DeepSeek V3 y superar a GPT-4o, Gemini 2.0 y Claude 3 Opus en tareas de razonamiento, codificación y comprensión de contenido visual y textual.

 

Meta destaca que este modelo permite “la creación de sofisticadas aplicaciones de IA que trascienden las barreras del lenguaje. Como nuestro modelo de referencia para asistentes conversacionales y usos generales, Llama 4 Maverick es ideal para la interpretación precisa de imágenes y la escritura creativa”.

 

Fuente: wired

Leave A Comment

Your email address will not be published. Required fields are marked *