BLOOMZ & mT0 : modèles de langage pour suivre les instructions humaines
BLOOMZ et MT0 sont une famille de modèles basés sur les modèles BLOOM de BigScience et MT5 de Google. Ces modèles ont été spécialement conçus pour suivre les instructions humaines dans des langues naturelles.
Création de BLOOMZ et MT0
Les modèles BLOOMZ et MT0 ont été affinés à l'aide de l'ensemble de données xP3 de BigScience, créant ainsi une variété de nouveaux modèles capables de suivre des instructions humaines. Les deux principaux ensembles de données utilisés pour l'affinage des modèles sont :
- xP3 : Version de base de l'ensemble de données, comprenant 13 tâches d'entraînement à travers 46 langues avec des invites en anglais.
- xP3mt : Cette version comprend des invites dans 19 langues supplémentaires, toutes traduites automatiquement à partir des invites en anglais.
Que peuvent faire BLOOMZ et MT0 ?
Ces modèles ont été affinés pour répondre aux invites en langage naturel, telles que les questions, les directions et les phrases à traduire. Ils peuvent expliquer des concepts dans d'autres langues, répondre à des questions sur un texte donné, résoudre des problèmes mathématiques ou exécuter d'autres tâches du même ordre. Bien que la majorité des modèles aient été affinés à l'aide de l'ensemble de données xP3, qui ne comprend que des invites en anglais, il est toujours possible de solliciter ces modèles dans d'autres langues prises en charge.
Vous pouvez tester les modèles vous-même en utilisant l'API d'inférence hébergée sur les pages Hugging Face de la famille de modèles BLOOMZ et MT0.
En savoir plus
Pour explorer la gamme complète de modèles, consultez les pages Hugging Face de la famille de modèles BLOOMZ ou MT0. Pour en savoir plus sur les ensembles de données xP3, consultez la documentation associée. Vous pouvez également lire l'article complet sur la création de ces nouveaux modèles.