Anthropic annonce le lancement de Claude 2, un nouveau modèle d'IA

Anthropic, une entreprise spécialisée dans l'intelligence artificielle, a récemment annoncé le lancement de Claude 2, son nouveau modèle. Ce dernier présente des performances améliorées, des réponses plus longues et peut être accessible via une API ainsi que via un nouveau site web en version bêta publique, claude.ai.

Des performances améliorées

Selon les retours des utilisateurs, Claude est facile à utiliser, explique clairement sa pensée, est moins susceptible de produire des sorties nuisibles et a une mémoire plus longue. Des améliorations ont été apportées par rapport aux modèles précédents en matière de codage, de mathématiques et de raisonnement. Par exemple, le dernier modèle a obtenu 76,5% à la section à choix multiples de l'examen du Barreau, contre 73,0% avec Claude 1.3. Comparé aux étudiants universitaires postulant à des études supérieures, Claude 2 obtient des scores supérieurs au 90e percentile aux examens de lecture et d'écriture du GRE, et de manière similaire à la candidature médiane en raisonnement quantitatif.

Un assistant personnel ou un collègue enthousiaste

Claude peut être considéré comme un collègue amical et enthousiaste ou un assistant personnel qui peut être instruit en langage naturel pour aider à de nombreuses tâches. L'API Claude 2 pour les entreprises est proposée au même prix que Claude 1.3. De plus, toute personne aux États-Unis et au Royaume-Uni peut commencer à utiliser l'expérience de chat en version bêta dès aujourd'hui.

Des capacités étendues

Dans le cadre de l'amélioration à la fois des performances et de la sécurité des modèles, la longueur des entrées et des sorties de Claude a été augmentée. Les utilisateurs peuvent entrer jusqu'à 100 000 jetons dans chaque invite, ce qui signifie que Claude peut travailler sur des centaines de pages de documentation technique ou même un livre. Claude peut maintenant également rédiger des documents plus longs - des mémos aux lettres en passant par des histoires de quelques milliers de jetons - en une seule fois.

Des compétences en codage améliorées

De plus, le dernier modèle a grandement amélioré ses compétences en codage. Claude 2 a obtenu 71,2% contre 56,0% sur le Codex HumanEval, un test de codage Python. Sur GSM8k, un grand ensemble de problèmes de mathématiques de niveau école primaire, Claude 2 a obtenu 88,0% contre 85,2%. Anthropic a une feuille de route passionnante d'améliorations des capacités prévues pour Claude 2 et prévoit de les déployer lentement et de manière itérative dans les mois à venir.

Une sécurité renforcée

Anthropic a travaillé à améliorer la sécurité sous-jacente de Claude 2, de sorte qu'il soit plus inoffensif et plus difficile à inciter à produire des sorties offensantes ou dangereuses. L'entreprise a une évaluation interne de red teaming qui note ses modèles sur un grand ensemble représentatif de prompts nuisibles, en utilisant un test automatisé tandis qu'elle vérifie également régulièrement les résultats manuellement. Dans cette évaluation, Claude 2 était 2 fois meilleur pour donner des réponses inoffensives comparé à Claude 1.3. Bien qu'aucun modèle ne soit à l'abri des évasions, Anthropic a utilisé une variété de techniques de sécurité, ainsi qu'un red teaming étendu, pour améliorer ses sorties.

Disponibilité et utilisation

Claude 2 alimente l'expérience de chat d'Anthropic et est généralement disponible aux États-Unis et au Royaume-Uni. Anthropic travaille à rendre Claude plus largement disponible dans le monde dans les mois à venir. Les utilisateurs peuvent maintenant créer un compte et commencer à parler à Claude en langage naturel, en lui demandant de l'aide pour toutes les tâches qu'ils aiment. Parler à un assistant IA peut nécessiter quelques essais et erreurs, alors il est recommandé de lire les conseils d'Anthropic pour tirer le meilleur parti de Claude.

Collaboration avec des entreprises

Anthropic travaille actuellement avec des milliers d'entreprises qui utilisent l'API Claude. L'un des partenaires est Jasper, une plateforme d'IA générative qui permet aux individus et aux équipes de développer leurs stratégies de contenu. Jasper a constaté que Claude 2 était capable de rivaliser avec d'autres modèles de pointe pour une grande variété de cas d'utilisation,

mais a une force particulière pour les utilisations à faible latence de longue forme. "Jasper est vraiment heureux d'être parmi les premiers à proposer Claude 2 à ses clients, apportant une sémantique améliorée, une formation à jour des connaissances, un raisonnement amélioré pour des prompts complexes, et la capacité de remixer sans effort du contenu existant avec une fenêtre de contexte 3 fois plus grande", a déclaré Greg Larson, VP of Engineering chez Jasper. "Jasper est fier d'aider ses clients à rester à la pointe de la technologie grâce à des partenariats comme celui-ci avec Anthropic."

Conclusion

Anthropic accueille les commentaires alors qu'elle travaille à déployer de manière responsable ses produits de manière plus large. L'expérience de chat est un lancement en version bêta ouverte, et les utilisateurs doivent être conscients que Claude - comme tous les modèles actuels - peut générer des réponses inappropriées. Les assistants IA sont les plus utiles dans les situations de tous les jours, comme servir à résumer ou organiser des informations, et ne devraient pas être utilisés là où la santé physique ou mentale et le bien-être sont impliqués. Anthropic invite les utilisateurs à lui faire savoir s'ils souhaitent parler à Claude dans une zone actuellement non prise en charge, ou si ils sont une entreprise qui souhaiterait commencer à travailler avec Claude.

Source