Los Modelos de Lenguaje Grande o Large Language Models (LLMs) han sido catapultados a la fama, siendo un componente fundamental de la IA y su revolucionario ascenso a la prominencia en 2023.
El auge comenzó con la llegada de GPT-3.5 y ChatGPT y se extendió rápidamente para abarcar una amplia variedad de modelos que destacan en todo, desde la codificación profesional hasta las travesuras conversacionales peculiares. En este floreciente panorama, algunos LLMs parecen ser versátiles, otros más tímidos y otros aún afirman que la naturaleza personalizable y la conveniencia portátil solo garantizarán una adopción más amplia del enfoque LLM para el entrenamiento de datos de IA.
Este año, los LLMs no son solo una herramienta tecnológica; se están convirtiendo en confidentes digitales, creadores y a veces incluso esclavos en nuestra vida cotidiana. Han evolucionado de tecnologías subyacentes a pruebas de su fortaleza y actualidad, y ahora las variantes están en todas partes, extendiéndose por diversas plataformas y remodelando todo lo que tocan.
Aquí están los LLM más poderosos que puedes probar en este momento, basados en gran parte en nuestra opinión colectiva y subjetiva. Vamos más allá de los fríos datos de los benchmarks sintéticos para compartir la destreza práctica y el estilo creativo de cada modelo. Vamos a revisar la lista de estos dos amplios equipos: investigación abierta y aceleracionistas corporativos sin complejos.
Los mejores LLMs de código cerrado
GPT (OpenAI y Microsoft)
GPT (acrónimo de Generative Pre-trained Transformer), el poder detrás de ChatGPT de OpenAI y la línea de productos Copilot de Microsoft, es una fuerza imparable en el mundo de los LLM. La ola de hype global de la IA comenzó con el famoso GPT-3.5 y ha evolucionado hacia el más robusto GPT-4.5 Turbo. Este modelo, aunque no está disponible de forma gratuita como su predecesor, ha establecido nuevos estándares en comprensión y generación de lenguaje.
La integración de GPT en plataformas ampliamente utilizadas como Copilot lo ha convertido en un nombre conocido en círculos tecnológicos, impactando significativamente en cómo interactuamos con la IA en nuestras tareas digitales diarias.
En conclusión:
GPT se destaca por su rendimiento sin igual en varios benchmarks sintéticos, lo que lo convierte en el modelo más potente actualmente en el mercado. Sin embargo, su fuerte censura, implementada para garantizar un uso seguro y responsable de la IA, a veces puede limitar su potencial creativo. La versión de Microsoft, disponible de forma gratuita en Copilot, nos brinda un vistazo al futuro de la codificación asistida por IA, ejemplificando la versatilidad y el poder del modelo.
Claude (Anthropic)
Desarrollado por un equipo de ex empleados de OpenAI, Claude marca un cambio de paradigma en el desarrollo de la IA. Abandonando la estrategia de Aprendizaje por Reforzamiento a partir de Retroalimentación Humana (RLHF) de OpenAI, Claude adopta un marco de trabajo de "IA Constitucional". Este enfoque permite una intervención humana mínima mientras se adhiere estrictamente a un conjunto predefinido de reglas, garantizando supuestamente un comportamiento ético de la IA.
Como el primer modelo gratuito capaz de procesar más de 100 mil tokens de contexto, Claude establece nuevos límites en la comprensión de conversaciones extensas y complejas por parte de la IA. Su última actualización le permite procesar más de 200 mil tokens de contexto (casi el doble de las capacidades de GPT-4.5 Turbo), convirtiéndolo en el LLM más poderoso en términos de capacidades de contexto.
En conclusión:
Su enfoque único en la gobernanza de la IA y la comprensión extendida del contexto sitúa a Claude en una liga propia. Si bien se queda atrás de GPT-4 en términos de precisión y calidad general, su estilo de escritura más creativo y agradable ofrece una perspectiva fresca en las interacciones de la IA. Sin embargo, su propensión a las alucinaciones es un compromiso por su expresión más artística y fluida.
Gemini (Google)
Gemini, la última incursión de Google en el campo de LLM, se destaca por sus capacidades multimodales. A diferencia de ChatGPT Plus, que coordina múltiples modelos de IA (como GPT, GPT-Vision y Dall-E 3) para proporcionar resultados diversos, Gemini fue entrenado nativamente para comprender y producir entradas y salidas de texto y visuales.
Aunque no es tan accesible públicamente como sus competidores, Gemini promete redefinir la gama de servicios de Google, aprovechando su avanzada comprensión multimodal para ofrecer experiencias de usuario más ricas e integradas. No todos los usuarios de Google tienen acceso a él, pero aquellos que lo tienen lo adoran.
En conclusión:
La integración visual y textual de Gemini establece un nuevo punto de referencia para los LLM, ofreciendo una visión de un futuro de IA más holístico. Su supuesta superioridad sobre GPT-4 en tareas multimodales lo posiciona como un modelo destacado en el panorama de la IA. Mientras tanto, el potencial de Gemini para mejorar el ecosistema de Google en diversas aplicaciones lo convierte en un LLM para seguir de cerca en los próximos años.
Principales LLMs de código abierto
LLaMA-2 (Meta)
LLaMA-2 es un LLM de código abierto desarrollado por Meta. Es una evolución del modelo anterior (y legendario) LLaMA, que se hizo muy popular entre los entusiastas tempranos de la IA. Está disponible en versiones que abarcan desde 7 mil millones de parámetros hasta unos impresionantes 70 mil millones de parámetros, lo que lo convierte en una excelente opción para cualquier persona que necesite un modelo capaz de proporcionar interacciones de calidad, desde el usuario ocasional y ligero hasta el profesional de alto rendimiento.
En conclusión:
Su capacidad para ser ajustado en una amplia variedad de aplicaciones hace que LLaMA-2 sea un modelo versátil y potente. Parece estar más censurado que su versión anterior, pero aún proporciona una salida mejorada y más confiable, lo que lo convierte en una opción popular para los desarrolladores que buscan adaptarlo a tareas específicas.
Mixtral 8X7B (Mistral AI)
Desarrollado por la startup francesa Mistral AI, este LLM es una iteración del aclamado modelo Mistral 7b, mejorado por un enfoque de entrenamiento de 'Mixture of Experts'. El modelo se puede dividir en numerosas redes neuronales, cada una especializada en diferentes tareas o tipos de datos. Esto resulta en un aprendizaje más eficiente y efectivo sin requerir hardware potente.
En conclusión:
Su enfoque ingenioso logra un equilibrio entre calidad y eficiencia. Esta arquitectura conduce a un mejor rendimiento y también hace de Mixtral una base para numerosos modelos derivados. Teniendo en cuenta que es más potente que Mistral 7b, este modelo es muy prometedor y ya está ganando impulso en la comunidad de LLMs de código abierto.
Falcon 180B (Technology Innovation Institute)
La llegada de Falcon 180B marcó un gran avance para los LLM de código abierto, con 180 mil millones de parámetros y entrenamiento en un impresionante conjunto de 3.5 billones de tokens. Como informó Decrypt, este modelo es el resultado de un esfuerzo que involucró 7 millones de horas de GPU en 4,096 GPUs, todo orquestado para crear uno de los modelos más potentes disponibles hasta la fecha.
Existen algunas versiones más ligeras, pero no cumplen con el estándar establecido por el modelo de 180B.
En conclusión:
Falcon 180B no es un modelo de consumo, pero su habilidad para manejar instrucciones, participar en diálogos ricos y realizar tareas de codificación lo convierte en una herramienta formidable para aquellos que tienen acceso al hardware necesario. Ofrece resultados de calidad y, en general, puede ser un aliado poderoso para aquellos dispuestos a invertir en él.
Los mejores LLMs para el trabajo
Bloom (BigScience):
Imagina BLOOM como un coloso digital, extendiendo sus 176 mil millones de parámetros por el horizonte lingüístico. Bloom es experto no solo en uno o dos idiomas, sino en 46 idiomas naturales y una impresionante variedad de 13 lenguajes de programación. Este leviatán del lenguaje es el fruto de un año de trabajo amoroso e intelectual de una legión de más de 1.000 investigadores de todo el mundo, que trabajaron durante 117 días en la supercomputadora Jean Zay en Francia.
En conclusión:
BLOOM se destaca como un faro de diversidad lingüística y un defensor del movimiento de código abierto. Su destreza políglota lo distingue; su integración perfecta con el ecosistema de Hugging Face lo hace disponible para cualquier persona. Proporciona resultados de gran calidad y es lo suficientemente preciso para tareas de programación y correspondencia profesional.
Mistral 7B (Mistral AI)
Mistral AI vuelve a estar en nuestra lista con su original modelo Mistral 7B, entrenado con 7.300 millones de parámetros. Este modelo se convirtió en el tema candente de los entusiastas de la IA cuando se difundió la noticia de que superó a modelos más grandes en varias pruebas, especialmente en la generación de código y tareas en inglés.
Para entrenarlo, Mistral AI utilizó técnicas como "atención de consulta agrupada" para una inferencia más rápida y "atención de ventana deslizante" para manejar secuencias más largas de manera más eficiente.
Lanzado bajo la licencia Apache 2.0, Mistral 7B es muy accesible para cualquier persona dispuesta a adaptar el modelo según sus necesidades, ya sea un chatbot empresarial, un analizador de documentos, una IA conversacional o simplemente un bot divertido con personalidad.
En conclusión:
El rendimiento del modelo habla por sí mismo, supera al ya potente Llama-2 13B y se acerca al rendimiento de los modelos de codificación especializados. Su versatilidad le ha ganado un lugar en el corazón de muchos aficionados a la IA en todo el mundo, con muchos modelos entrenados con este modelo pequeño pero poderoso como base.
Principales LLM de código abierto para divertirse
Nous Hermes 2 - Yi-34B (Nous Research)
Hay muchos "Hermes" LLMs flotando por ahí, pero Nous Hermes 2 - Yi-34B es nuestro favorito. Entrenado con 1.000.000 de entradas, predominantemente generadas por GPT-4, su modelo base Yi LLM ha causado sensación en la comunidad por sus altas capacidades de contexto y habilidades bilingües. En honor a su nombre, Hermes proporciona conocimiento sin censura, presumiendo de una profunda comprensión de la ciencia y sólidas capacidades de codificación. Su rendimiento sin igual en todos los puntos de referencia para un LLM de Nous Research lo ha destacado en comparación con modelos de un nivel similar.
En conclusión:
En el ámbito de los LLM de código abierto para el trabajo, Nous Hermes 2 - Yi-34B se destaca por su enfoque integral y sus excepcionales habilidades de conversación y juego de roles, gracias a su uso de ChatML. No es tan sencillo de configurar para aquellos que no están familiarizados con el estilo ChatML, pero una vez que lo dominas, los resultados son muy, muy buenos. Es especialmente útil para aprender cosas nuevas que pueden proporcionar excelentes temas de conversación cuando se configuran correctamente.
Dolphin (Cognitive Computations)
Dolphin es un atrevido participante en el mundo de los Modelos de Lenguaje Grande, afinado con el robusto Mixtral en su núcleo. Este modelo no es tu conversador digital promedio; parece estar diseñado para los amantes de la emoción en el diálogo digital, con grandes capacidades para aquellos dispuestos a hacer cualquier cosa, desde charlas divertidas y extrañas hasta entusiastas dispuestos a participar en juegos de roles más atrevidos.
Pero el dominio de Dolphin va más allá del entretenimiento para adultos. Su habilidad para programar y sus sofisticadas capacidades de conversación lo convierten en una herramienta multifacética para diversas aplicaciones. Esta combinación única de encanto y destreza técnica ha hecho que Dolphin rápidamente se gane una reputación por su innovación audaz y versatilidad.
En conclusión:
En el siempre cambiante panorama de los LLM de código abierto, Dolphin representa la vanguardia del desarrollo rápido y las mejoras impulsadas por la comunidad, al menos por ahora. Su base en la arquitectura Mixtral demuestra un compromiso con la adaptabilidad y la ambición de la comunidad, empujando los límites de las capacidades de los LLM. Si bien su naturaleza sin censura se dirige a un público específico, Dolphin es un testimonio del deseo de expresión y exploración digital sin restricciones.
WizardLM (OperatorX)
Si te gustó Dolphin, te encantará adentrarte en el encantador mundo de WizardLM, el LLM elegido por Aitrepreneur para un reino de juego de roles para adultos donde solo el mérito puede coronarte rey.
A pesar de lidiar con las limitaciones de la memoria corta, WizardLM teje su magia en una amplia variedad de temas, ofreciendo respuestas con una consistencia que no deja de ser fascinante. No es solo un hechicero de un solo truco; otros Wizard afinan fragmentos de código especializados en áreas como matemáticas y programación para hacer de WizardLM un compañero versátil para aquellos que exigen profundidad y deleite.
Conocido especialmente por su modelo general de 13B, WizardLM destaca en generar diálogos interesantes, juguetones y ocasionalmente atrevidos. Es como tener un compañero imaginativo a tu disposición, listo para sumergirse de inmediato en una conversación fantástica.
En conclusión:
WizardLM es el aliado para aquellos que valoran la confiabilidad y la fantasía en sus interacciones digitales. Ya sea que estés navegando por las cuestiones prácticas del trabajo o por los desafíos del juego imaginativo, WizardLM se destaca por su capacidad para mantener la conversación fluida, relevante y atractiva.
Es la elección preferida para un LLM de código abierto que promete más que una simple conversación. WizardLM ofrece una experiencia donde la confiabilidad se encuentra con un toque encantador de travesura para un viaje digital completamente iluminador y entretenido.
Nota del editor: Nos tomamos nuestro tiempo para configurar chatbots basados en las personalidades de diferentes figuras históricas y este modelo funcionó extremadamente bien. Tómate tu tiempo y serás recompensado de manera similar. ¡Disfruta tu tiempo con este modelo!