Meta presentó Llama 3.1 405B, el primer modelo abierto capaz de competir con GPT-4o. El gigante tecnológico no quiere quedar rezagado en la carrera de la inteligencia artificial, aunque ha optado por un camino distinto a OpenAI y Google. En lugar de desarrollar modelos cerrados como Gemini o GPT-4, apuesta por el código abierto para potenciar sus aplicaciones.
De acuerdo con Meta, Llama 3.1 405B es el modelo fundacional más grande y con más capacidades del mundo. La tecnológica ha entrenado a su IA con más de 15 billones de tokens, priorizando tanto la cantidad como la calidad de los datos. El modelo rivaliza con GPT-4o en conocimientos generales, matemáticas o traducción a múltiples idiomas, por nombrar algunas.
Llama 3.1 405B cuenta con una arquitectura de modelo de transformador con un solo decodificador estándar. Meta señala que el proceso de entrenamiento fue uno de sus retos más grandes a la fecha debido a la cantidad de datos. La compañía optimizó la pila de entrenamiento y adoptó un proceso iterativo posterior para mejorar las respuestas al usuario y garantizar la seguridad.
«Equilibramos cuidadosamente los datos para producir un modelo de alta calidad en todas las capacidades», mencionó la empresa. «Nuestro modelo continúa brindando respuestas de máxima utilidad, incluso cuando agregamos mitigaciones de seguridad».
- CHECALO -
Comparado con las versiones anteriores, Llama 3.1 405B está en el siguiente nivel. Meta afirma que las primeras evaluaciones muestran que su IA puede competir de frente con modelos de gran calibre, como GPT-4, GPT-4o y Claude 3.5 Sonnet. La compañía ha puesto énfasis en su conjunto de datos, con una curación más cuidadosa previo al entrenamiento, así como también un filtrado y control de calidad más riguroso para las etapas posteriores.
Con Llama 3.1 405B, Meta sigue apostando por las IA de código abierto
Una de las características que distinguen a los modelos de lenguaje de Meta es que son de código abierto. Con Llama 3.1 405B se mantienen en el mismo camino, ya que según Mark Zuckerberg, es el único modo en que nos beneficiaremos todos. El cofundador de Facebook publicó una carta en la que explica por qué el código abierto es importante y hace referencia a Linux.
De acuerdo con Zuckerberg, el código abierto es necesario para un futuro positivo de la inteligencia artificial. El jefe de Meta indica que la IA tiene un potencial único para aumentar la productividad, creatividad y calidad de vida de las personas. De igual modo, puede ser un catalizador para la investigación científica y el crecimiento económico.
Zucks tira un gancho a OpenAI, Google y otras empresas que desarrollan modelos de código cerrado. «Muchas organizaciones no quieren depender de modelos que no pueden ejecutar ni controlar por sí mismas. Tampoco quieren quedar atrapados en una única nube que tenga derechos exclusivos sobre un modelo.»
A diferencia de GPT-4o, Llama 3.1 405B no es pieza clave en el modelo de negocio de Meta. Mark Zuckerberg añade que hacer su IA de código abierto no socava los ingresos, sostenibilidad o la capacidad de invertir en investigación. El directivo señala que esta es la razón por la que las empresas critican los modelos open source, sin embargo, la IA de código abierto será la mejor opción en un futuro.
Meta considera que el lanzamiento de Llama 3.1 405B será un punto de inflexión en la industria. La compañía está enfocándose en construir un ecosistema más amplio para que más desarrolladores y empresas utilicen sus modelos de IA. Los usuarios pueden probar gratis el nuevo modelo a través de meta.ai en la web.
DERECHOS DE AUTOR
Esta información pertenece a su autor original y fue recopilada del sitio https://hipertextual.com/2024/07/meta-llama-3-1-405b-codigo-abierto-open-ai-gpt-4o