Les modèles d'intelligence artificielle décentralisés, open-source et robustes peuvent-ils rivaliser avec des modèles propriétaires bien financés comme le puissant GPT-4 d'OpenAI ? Cette question fréquemment posée a alimenté un débat animé sur Twitter après qu'un ancien chercheur en IA de Google a pris parti.
Arnaud Benard, co-fondateur de Galileo AI, a lancé un défi en déclarant : «Si vous pensez que les modèles open-source vont battre GPT-4 cette année, vous vous trompez.» Il a cité le talent et les ressources d'OpenAI ainsi que la nature robuste de GPT-4 en tant que produit au-delà d'un LLM, et a affirmé que les projets open-source pourraient avoir du mal à passer du statut de challengers à celui de champions de l'IA.
Sans surprise, le tweet de Benard a suscité des réactions mitigées, allant du soutien véhément à de vives désaccords.
Ryan Casey, un enthousiaste de l'IA populaire qui rédige la newsletter «Beyond The Yellow Woods», a offert une vision plus optimiste du potentiel de l'IA open-source, déclarant : «L'open source égalera ou surpassera [les modèles privés] cette année», selon ses calculs. «S'il y a une demande, il y aura de l'innovation.»
D'autre part, le stratège en IA Jeremi Traguna a noté que «les modèles d'OpenAI continuent de bouger», ajoutant que «les modèles open source auront du mal à suivre le rythme pour atteindre une cible en mouvement au moment où la cible est en position d'être atteinte». En d'autres termes, alors que les modèles open source pourraient rattraper GPT-3.5 à l'ère de GPT-4, il pourrait y avoir un GPT-5 au moment où nous aurons des LLM généralistes comparables à GPT-4.5 Turbo.
Un analyste technologique, Jon Howells, estime que les ressources ne sont pas le seul critère de distinction entre les LLM open source et fermés.
«Mistral dispose d'un financement important, d'une excellente équipe et a récemment publié un modèle open source supérieur à GPT-3.5», a-t-il écrit. «Ils ou une entreprise similaire publieront un modèle open source de niveau GPT-4 d'ici la fin de cette année.»
Mistral AI, une startup française, a été reconnue après avoir publié son Mixtral LLM, qui offre des performances améliorées par rapport à GPT-3.5 dans de nombreux cas d'utilisation.
Dans une discussion en fil, le cofondateur de Nous Research, «Teknium», a fait une remarque importante, mais philosophique. «Chaque augmentation des capacités dans les systèmes d'exploitation (Open Source) est une chose permanente qui ne peut jamais être retirée du monde et qui peut être utilisée de manière fiable pour toujours», a-t-il déclaré. En gros, tant qu'il y a des avancées dans la technologie d'intelligence artificielle open source, aucune entreprise ne peut restreindre son accès.
Ouvert ou fermé ? Un débat sans fin
Le débat entre open source et closed source rappelle les premières batailles entre Windows et Linux pour les systèmes d'exploitation. Santiago Pino de ML School a écrit que les modèles d'IA propriétaires peuvent séduire les consommateurs généraux comme l'a fait Windows, mais que les logiciels open source offrent une personnalisation et un contrôle extrêmement utiles pour les utilisateurs d'entreprise.
Pino a souligné comment de nombreuses entreprises commencent à expérimenter avec ChatGPT, mais passent ensuite à des modèles open source, qu'elles peuvent affiner et personnaliser en fonction de leurs besoins spécifiques et des exigences de conformité des données. Les solutions open source évitent le verrouillage par le fournisseur et offrent une transparence, a-t-il déclaré.
«Les modèles fermés et propriétaires peuvent séduire les particuliers, mais la plupart des entreprises ne veulent pas envoyer leurs données à Microsoft ou Google. Elles veulent avoir le contrôle. Les modèles open source sont la réponse», a-t-il déclaré dans un tweet quelques jours avant que le fil de Bernard ne devienne viral.
Ce point de vue a été partagé dans le débat sur le tweet de Bernard par Sciumo Inc., une société de développement de logiciels, qui a souligné le potentiel de niche des modèles open source : «(Les modèles open source) vont concurrencer là où cela compte : les problèmes spécifiques à un domaine avec des données et une expertise spécifiques que (OpenAI) n'a pas.»
Furkan Gözükara, un ingénieur informaticien connu pour sa chaîne YouTube SECourses, fait également partie de ceux qui adoptent une position plus nuancée. Dans une interview avec Decrypt, il a convenu avec Bernard, affirmant que «seulement pour des tâches spécifiques, les LLM open source surpasseront OpenAI.»
Gözükara donne l'exemple d'une entreprise qui «forme LLM sur ses propres documents». Oui, OpenAI a la capacité de personnaliser les GPT en fonction d'instructions et de documents spécifiques, mais la gestion de données sensibles par des tiers est toujours une préoccupation. Cette préoccupation a récemment été validée lorsque l'on a découvert que des GPT personnalisés divulguaient des données sensibles à des utilisateurs tiers.
Yan Lecun, responsable du développement de l'IA chez Meta et un féroce défenseur de l'open source, a déclaré à plusieurs reprises que «les modèles de base d'IA open source élimineront les modèles d'IA fermés et propriétaires». Google, un autre géant de l'IA, reconnaît également la menace posée par l'IA open source : «Les modèles open source sont plus rapides, plus personnalisables, plus privés et plus performants, livre pour livre», selon une note interne Google divulguée en 2023.
Il reste à voir si les modèles open source pourront égaler ou dépasser GPT-4 et les futures itérations cette année. Cependant, les perspectives des experts des deux côtés révèlent une tension intrigante. Les modèles en source fermée peuvent avoir un avantage en termes de ressources et d'itération rapide, mais les outils open source évoluent rapidement, offrant des capacités permanentes et une personnalisation. Pour l'instant, la communauté de l'IA peut observer la compétition se dérouler et profiter des avantages de l'utilisation de la meilleure technologie disponible.
Édité par Ryan Ozawa.
Generally Intelligent Newsletter
A weekly AI journey narrated by Gen, a generative AI model.