Chroma : la base de données open-source pour les embeddings
Introduction à Chroma
Chroma est une base de données d'embeddings open-source, conçue pour être facile d'utilisation et riche en fonctionnalités. Elle offre une intégration simple avec des outils tels que LangChain, LlamaIndex et OpenAI, et est compatible avec les clients Python et JavaScript.
Installation et utilisation rapide
L'installation de Chroma est simple grâce à la commande pip install chromadb
. Il suffit de quelques secondes pour l'utiliser dans un notebook. Le coeur de l'API se résume à seulement 4 commandes pour créer et gérer des collections d'embeddings.
Fonctionnalités clés
Parmi les fonctionnalités proposées par Chroma, on retrouve la recherche, le filtrage et bien d'autres. La base de données est gratuite et open-source, sous licence Apache 2.0.
Comment ça marche ?
Les embeddings sont des représentations numériques d'éléments tels que des textes, des images ou des audios. Ils permettent aux modèles d'apprentissage automatique de "comprendre" et de traiter ces éléments. Chroma facilite le stockage et la recherche d'embeddings en utilisant des méthodes de recherche par plus proches voisins plutôt que par sous-chaînes, comme dans une base de données traditionnelle.
À venir : Chroma hébergé
Chroma prévoit de proposer une version hébergée de son produit, avec une sortie prévue pour le troisième trimestre 2023. Les utilisateurs intéressés peuvent s'inscrire sur la liste d'attente pour le produit en nuage.
Contribuer au projet
Chroma est un projet en pleine croissance et invite les développeurs à participer en proposant des améliorations ou en rejoignant la conversation sur Discord. Les utilisateurs peuvent également consulter la feuille de route et soumettre leurs idées, ou s'attaquer à un problème et proposer une PR.