Together, la startup IA, lève des fonds pour l'IA open-source et la plateforme cloud
La startup IA, Together, a annoncé aujourd'hui avoir levé 20 millions de dollars lors de son tour de financement initial. Son objectif est de créer des alternatives décentralisées aux systèmes d'IA fermés et de démocratiser l'IA pour tous.
"Notre mission est d'autonomiser l'innovation et la créativité en fournissant des modèles d'IA génératifs open-source de premier plan et une plateforme cloud innovante qui rend l'IA accessible à tous, partout." - Jamie de Guerre, SVP fondateur du produit chez Together.
L'ambition d'ouvrir l'IA
Together vise à établir l'open source comme la voie par défaut pour intégrer l'IA et à aider à créer des modèles ouverts qui surpassent les modèles fermés. Dans ce but, l'entreprise a déjà collaboré avec des fournisseurs d'infrastructures décentralisées, des groupes open-source, ainsi que des laboratoires de recherche académiques et corporatifs.
Elle a d'ailleurs déjà lancé plusieurs projets d'IA génératifs, dont GPT-JT, OpenChatKit, et RedPajama, qui ont reçu le soutien de centaines de milliers de développeurs d'IA. Les fonds nouvellement levés serviront à élargir l'équipe, et à augmenter la recherche, le produit et l'infrastructure.
L'importance de l'open-source pour la transparence des données
Together donne la priorité à la mise en place de l'IA open-source en fournissant des ensembles de données, des modèles et de la recherche. Le projet RedPajama est une première initiative prometteuse, mais ne représente que le début des efforts de l'entreprise.
La seconde ambition de Together est de rendre les ressources informatiques pour l'entraînement, le réglage fin et l'exploitation de grands modèles plus accessibles. Elle prévoit de fournir cela avec une plateforme cloud révolutionnaire spécifique à l'IA, construite sur un réseau informatique décentralisé.
Jamie de Guerre souligne que les modèles fermés présentent également des risques de responsabilité et des défis, car le client n'a aucune visibilité sur le fonctionnement du modèle ou sur ce sur quoi il a été formé. C'est pourquoi Together rend les ensembles de données et les modèles entièrement open-source pour contrer cette tendance et permettre une infrastructure informatique plus accessible pour l'entraînement ou l'utilisation de grands modèles.
Une plateforme cloud spécialisée en IA
Avec les nouveaux fonds acquis, l'entreprise prévoit d'améliorer sa plateforme cloud spécialisée, conçue pour optimiser efficacement la mise à l'échelle de l'entraînement et de l'inférence pour de grands modèles grâce à l'optimisation distribuée. Cela permettra de personnaliser rapidement et de connecter les modèles de base avec des tâches de production.
Dans les mois à venir, Together prévoit d'ouvrir l'accès à cette plateforme, permettant une personnalisation rapide et un couplage des modèles de base avec des tâches de production de manière confidentielle et sécurisée.
"Cela permettra d'activer davantage la communauté open-source en rendant les ressources informatiques nécessaires pour l'entraînement et l'exploitation de ces grands modèles plus efficaces et accessibles." - déclare Jamie de Guerre.
S'attaquer aux goulots d'étranglement de l'open-source pour favoriser le progrès de l'IA
Selon de Guerre, l'entreprise favorise les avancées de l'IA open-source de deux façons. D'abord, elle s'associe à des groupes open-source et à des laboratoires de recherche d'entreprises pour publier des recherches, des ensembles de données et des modèles ouverts. Ensuite, l'entreprise s'associe à des fournisseurs d'infrastructures décentralisées pour fournir un accès amélioré à l'informatique pour l'entraînement, le réglage fin et l'exploitation de grands modèles.
De Guerre a noté que le réseau est l'un des principaux goulots d'étranglement pour l'entraînement de grands modèles de base.
"Non seulement vous avez besoin d'un grand nombre de GPU puissants, mais vous avez également besoin que ces GPU soient connectés par un réseau incroyablement rapide, généralement dans un seul lieu physique. Malheureusement, ce type de centre de données n'est disponible que pour un petit nombre d'organisations." - précise-t-il.
Ainsi, grâce à ses recherches, Together permet une réduction de plus de 200 fois du trafic réseau lors de l'entraînement ou du réglage fin des modèles. Cela signifie que l'on peut désormais utiliser des GPU à travers de multiples réseaux disparates pour participer à l'entraînement ou au réglage fin de grands modèles sans perdre la qualité du modèle produit.
De plus, l'entreprise a développé des technologies qui améliorent le débit d'inférence d'un ordre de grandeur.
Sécurité des données et perspectives d'avenir
Together affirme qu'elle ne stocke ni n'utilise par défaut les données des clients ou les données d'entraînement. Les clients peuvent choisir de partager leurs données avec Together pour l'entraînement des modèles.
"Nous investissons massivement dans la construction des meilleurs modèles d'IA génératifs open-source et d'une plateforme cloud spécifique à l'IA. Nous continuerons à publier des modèles open-source et d'autres projets pour soutenir cet objectif." - a déclaré de Guerre.
Il est convaincu que l'IA sera omniprésente et aura un impact énorme sur notre culture et notre société. Il souhaite que cet avenir soit basé sur des systèmes ouverts et participatifs, afin que nous puissions tous, en tant que société, façonner ce futur.
Le tour de financement initial de Together a été mené par Lux Capital et soutenu par plusieurs fonds de capital-risque, des investisseurs providentiels et des entrepreneurs de renom, dont le cofondateur de PayPal, Scott Banister, le cofondateur de Cloudera, Jeff Hammerbacher, et Lip-Bu Tan, le fondateur de Cadence Systems.