Llama Hub : une bibliothèque de chargeurs de données pour LlamaIndex et LangChain
À propos de LlamaHub
LlamaHub est une bibliothèque regroupant des chargeurs de données pour les modèles de langage (LLMs), créée par la communauté. Elle est conçue pour être utilisée avec LlamaIndex et LangChain, facilitant ainsi la connexion des modèles de langage à diverses sources de connaissances. LlamaHub propose des chargeurs pour lire et analyser des fichiers tels que Google Docs, bases de données SQL, fichiers PDF, présentations PowerPoint, Notion, Slack, Obsidian et bien d'autres.
Utilisation de LlamaHub
Les chargeurs de LlamaHub sont conçus pour être utilisés avec LlamaIndex et LangChain, permettant de charger facilement des données dans ces outils. Vous pouvez les utiliser en téléchargeant le chargeur souhaité depuis LlamaIndex avec une seule ligne de code. Par exemple, le code ci-dessous montre comment utiliser le chargeur Google Docs avec LlamaIndex et LangChain.
Ajouter un chargeur à LlamaHub
Pour ajouter un chargeur à LlamaHub, il suffit de créer un fork de ce dépôt et de soumettre une Pull Request. Voici les étapes à suivre pour ajouter un chargeur :
- Créez un nouveau répertoire dans
loader_hub
pour votre chargeur, avec un nom unique. Ajoutez-y un fichier__init__.py
vide, un fichierbase.py
contenant l'implémentation de votre chargeur et, si nécessaire, un fichierrequirements.txt
listant les dépendances de votre chargeur. - Rédigez un fichier
README.md
pour votre chargeur, en expliquant ce qu'il fait, ses entrées et comment il est utilisé dans le contexte de LlamaIndex et LangChain. - Ajoutez votre chargeur au fichier
loader_hub/library.json
pour qu'il puisse être utilisé par d'autres. Incluez le nom de classe de votre chargeur, son identifiant, l'auteur, etc. - Créez une Pull Request ! Les PR sont généralement examinées dans la journée.
FAQ
- Comment tester mon chargeur avant qu'il ne soit fusionné ? Vous pouvez modifier l'argument
loader_hub_url
dans la fonctiondownload_loader
pour pointer vers votre branche ou fork afin de tester votre nouveau chargeur. - Dois-je créer une PR pour LlamaHub ou directement pour le dépôt LlamaIndex ? Par défaut, créez une PR pour LlamaHub si vous avez un chargeur de données. Les PR concernant LlamaIndex doivent être créées directement pour le dépôt LlamaIndex.
- Pour toute autre question, n'hésitez pas à rejoindre le Discord de la communauté ou à contacter le compte Twitter officiel.