Open Source o OpenAI: ¿Cuál es el Mejor Camino Hacia la IA Avanzada?

Un largo tweet se volvió viral entre los entusiastas de la IA, reviviendo un debate de décadas sobre cómo evolucionará mejor la IA.

Por Jose Antonio Lanz

Jan 3, 2024

6 min lectura

Add on Google

En Resumen

Arnaud Benard, cofundador de Galileo AI, desafió la capacidad de los modelos de código abierto para superar a GPT-4, citando el talento y recursos de OpenAI.
Ryan Casey, entusiasta de la IA, optimista sobre el potencial de la IA de código abierto, afirmó que "el código abierto igualará o superará a los modelos privados este año".
El analista tecnológico Jon Howells indicó que la financiación no es el único criterio a tener en cuenta a la hora de hablar de los mejores LLMs, citando a Mistral AI, una startup francesa, que ha lanzado un modelo de código abierto superando a GPT-3.5.

¿Pueden los modelos de inteligencia artificial descentralizados y de código abierto competir con los propietarios bien financiados como el poderoso GPT-4 de OpenAI? La pregunta frecuente generó un animado debate en Twitter después de que un ex investigador de IA de Google tomara partido.

Arnaud Benard, cofundador de Galileo AI, lanzó el desafío, diciendo: "Si crees que los modelos de código abierto superarán a GPT-4 este año, estás equivocado". Citó el talento y los recursos de OpenAI y la naturaleza robusta de GPT-4 como un producto más allá de un LLM, y afirmó que los proyectos de código abierto podrían tener dificultades para pasar de ser desafiantes a campeones de IA.

if you think open-source models will beat gpt-4 this year, you're wrong.

i worked at top ai research labs (google ai) and built open-source libraries with > 5M monthly downloads.

gpt-4 is one year old and so far, no model matches it, here's why:

1. talent - openai recruited…

— Arnaud Benard (@arnaudai) January 1, 2024

El tweet de Benard generó reacciones mixtas, que van desde un apoyo enérgico hasta un feroz desacuerdo.

Ryan Casey, un popular entusiasta de la IA que escribe el boletín "Beyond The Yellow Woods", ofreció una visión más optimista sobre el potencial de la IA de código abierto, afirmando que "el código abierto igualará o superará a los modelos privados este año", según sus cálculos. "Si hay demanda, habrá innovación".

Eh, I think open source will match or beat this year. pic.twitter.com/y99qKJ2iKF

— Ryan Casey (@ryansweb) January 1, 2024

Por otro lado, el estratega de IA Jeremi Traguna señaló que "los modelos de OpenAI siguen avanzando", agregando que "los modelos de código abierto tendrán dificultades para mantenerse al día y alcanzar un objetivo en movimiento en el momento en que el objetivo esté en posición de ser alcanzado". En otras palabras, mientras que los modelos de código abierto podrían estar alcanzando a GPT-3.5 en la era de GPT-4, podría haber un GPT-5 para cuando tengamos LLM generalistas que sean comparables a GPT-4.5 Turbo.

Un analista tecnológico llamado Jon Howells, cree que los recursos no son el único criterio que separa a los LLM de código abierto de los de código cerrado.

"Mistral tiene una financiación enorme, un gran equipo y recientemente ha lanzado un modelo de código abierto que supera a GPT-3.5", escribió. "Ellos o una empresa similar lanzarán un modelo de código abierto de nivel GPT-4 para finales de este año".

Mistral AI, una startup francesa, ha ganado reconocimiento después de lanzar su LLM, que ofrece un rendimiento mejorado en muchos casos de uso en comparación con GPT-3.5.

Durante la discusión, el cofundador de Nous Research, "Teknium", destacó un punto importante, aunque filosófico. "Cada aumento de capacidad en OS (Open Source) es algo permanente que nunca se puede quitar del mundo y que se puede utilizar de manera confiable para siempre", dijo. Básicamente, siempre que haya algún avance en la tecnología de IA de código abierto, ninguna empresa puede restringir su acceso.

I introduced together and mistral, neither party is mad about it fwiw. But this post, he had said that no OS model will beat GPT-4, but GPT-4 will be old news - probably this year - it didnt take us long to beat 3.5, and Mistral CEO said he plans to release a GPT4 level Open…

— Teknium (e/λ) (@Teknium1) January 1, 2024

¿Abierto o cerrado? Un debate interminable

El debate entre código abierto y código cerrado recuerda a las primeras batallas de sistemas operativos entre Windows y Linux. Santiago Pino de ML School escribió que los modelos de IA propietarios pueden ganar a los consumidores generales como lo hizo Windows, pero que el software de código abierto proporciona personalización y control que pueden ser extremadamente útiles para los usuarios corporativos.

Pino destacó cómo muchas empresas comienzan a experimentar con ChatGPT, pero luego migran a modelos de código abierto, que pueden ajustar y personalizar según sus necesidades específicas y requisitos de cumplimiento de datos. Las soluciones de código abierto evitan el bloqueo del proveedor y brindan transparencia, dijo.

"Los modelos cerrados y propietarios pueden ganar a nivel individual, pero la mayoría de las empresas no quieren enviar sus datos a Microsoft o Google. Quieren tener control. Los modelos de código abierto son la respuesta", dijo en un tweet días antes de que el hilo de Bernard se volviera viral.

Open-source models will destroy ChatGPT and Gemini.

The story of open-source Large Language Models is the story of Linux. Windows and Mac won consumers, but Linux became the Internet's operating system.

The same will happen with ChatGPT, Gemini, and open-source models. Closed,… pic.twitter.com/fdmS1VNtqf

— Santiago (@svpino) December 22, 2023

Este tipo de opinión fue compartida en el debate sobre el tweet de Bernard por Sciumo Inc., una empresa de desarrollo de software, que enfatizó el potencial de nicho de los modelos de código abierto: "(Los modelos de código abierto) competirán donde importa: problemas específicos de dominio con datos y conocimientos específicos del dominio que (OpenAI) no tiene".

Furkan Gözükara, un ingeniero informático conocido por su canal de YouTube SECourses, también está entre aquellos con una postura más matizada. Hablando con Decrypt, estuvo de acuerdo con Bernard, diciendo que "solo en tareas específicas los LLM de código abierto superarán a OpenAI".

Gözükara da el ejemplo de una empresa que "entrena LLM en sus propios documentos". Sí, OpenAI tiene la capacidad de personalizar los GPTs basándose en instrucciones y documentos específicos, pero siempre existe la preocupación de manejar datos sensibles de terceros. Esa preocupación se validó recientemente cuando se reveló que los GPTs personalizados revelaron datos sensibles a usuarios de terceros.

Yan Lecun, jefe de desarrollo de IA de Meta y un feroz defensor del código abierto, ha afirmado repetidamente que "los modelos de base de IA de código abierto eliminarán los modelos de IA cerrados y propietarios". Google, otro gigante de la IA, también reconoce la amenaza que representa la IA de código abierto: "Los modelos de código abierto son más rápidos, más personalizables, más privados y más capaces en relación al peso", según un memo filtrado de Google en 2023.

Queda por ver si los modelos de código abierto igualarán o superarán a GPT-4 y a futuras iteraciones este año. Sin embargo, las perspectivas de los expertos de ambos lados revelan una tensión intrigante. Los modelos de código cerrado pueden tener ventaja en recursos y en iteración rápida, pero las herramientas de código abierto están evolucionando rápidamente, ofreciendo capacidades permanentes y personalizables.

Por ahora, la comunidad de IA puede observar cómo se desarrolla la competencia y disfrutar de los beneficios de utilizar la mejor tecnología disponible.

Editado por Ryan Ozawa.

Daily Debrief Newsletter

Start every day with the top news stories right now, plus original features, a podcast, videos and more.

Coin Prices