Meta s’est rapproché de Microsoft et a rendu son modèle IA LLaMA 2 open source. Une collaboration entre les différents grands modèles de langage se rapproche-t-elle ?
Il y a encore quelques mois, tout le monde se demandait qui allait gagner la course à l’IA. OpenAI prenait un départ fulgurant avec ChatGPT, Microsoft s’alignait sur OpenAI pour lancer Bing Chat, Google emboîtait le pas en lançant son propre chatbot IA Bard et Meta travaillait sur son propre grand modèle de langage baptisé LLaMA. Évidemment, d’autres startups, services et plateformes ont suivi le mouvement en lançant leurs outils IA et des utilisateurs curieux ont commencé à confronter les différents modèles les uns aux autres. Néanmoins, un accord récent entre Microsoft et Meta suggère que nous pourrions également assister à un nombre croissant de partenariats entre tous ces acteurs, et plus seulement une concurrence frontale.
Vers plus d’interactions entre les différents modèles IA ?
Jusqu’à maintenant, le développement des grands modèles de langage (LLM) a été relativement cloisonné et proposé dans des environnements « fermés » ou du moins très contrôlés. OpenAI a publié GPT-4 au mois de mars dernier en offrant aux développeurs un accès payant à la dernière version de son modèle avec la formule d’abonnement ChatGPT Plus. Le chatbot IA Google Bard est disponible en accès anticipé « expérimental », mais n’est pas open source. Apple développe également son propre LLM baptisé Ajax, mais très peu de détails ont filtré et nous ne savons pas s’il sera en licence ouverte.
Cependant, la semaine dernière Meta a commencé à proposer gratuitement son grand modèle de langage LLaMA sous licence ouverte et l’a intégré à la plateforme Microsoft Azure. Cette décision a mis en évidence les avantages de l’interopérabilité dans le domaine de l’IA. En outre, comme de plus en plus d’entreprises rejoignent ce domaine, ce ne sera probablement pas la dernière collaboration de ce type.
Au départ, LLaMA n’était pas disponible publiquement et n’était accessible que par l’intermédiaire de Meta, mais selon la société ce modèle a toujours été destiné à être open source pour « démocratiser davantage l’accès » à l’IA. Les utilisateurs de systèmes fermés doivent payer un droit de licence pour accéder au modèle IA là où il est hébergé et pour distribuer des applications utilisant ce même modèle. La mise à disposition de LLaMA aux utilisateurs de Microsoft Azure et sans licence (dans une certaine mesure), supprime donc cet inconvénient.
Le fait d’avoir plus de choix et des systèmes ouverts est une bonne nouvelle pour les défenseurs de l’interopérabilité des IA. Les LLM étant, par défaut, distincts les uns des autres, les développeurs doivent souvent choisir un modèle IA en particulier avec lequel ils souhaitent créer des outils et applications, il n’y a pas de moyen simple pour faire dialoguer les systèmes. Les systèmes « fermés » sont fréquents dans les technologies modernes, mais les défenseurs de l’interopérabilité de l’IA affirment que la seule façon pour l’IA d’évoluer dans le bon sens est à travers des structures ouvertes qui peuvent communiquer les unes avec les autres.
Un géant comme Microsoft croit en cette interopérabilité et a rejoint d’autres entreprises technologiques au sein de l’Open Neural Network Exchange (ONNX), un écosystème qui promeut une norme industrielle pour que les développeurs puissent trouver les bonnes combinaisons d’outils IA.
Rendre les systèmes d’IA capables de travailler en tandem pourrait permettre d’obtenir de meilleurs résultats. Les entreprises qui forment des modèles IA sur différents ensembles de données pourraient fournir un service meilleur et plus complet. De plus, si un modèle est erroné, l’interopérabilité pourrait éviter une dépendance excessive à l’égard d’une seule source d’information. Enfin, la possibilité de développer sur une même plateforme des modèles GPT pourrait réduire les coûts et les délais de développement.