StableVicuna : Le premier chatbot LLM RLHF open source
StableVicuna est le premier chatbot LLM (Large Language Model) open source à grande échelle entraîné via un apprentissage renforcé à partir des retours humains (Reinforcement Learning from Human Feedback - RLHF).
Site de Vicuna
Contexte
Récemment, il y a eu une poussée significative dans le développement et la publication de...