OpenAI : la liste des modèles ChatGPT, Whisper, DALL-E pour l'API

OpenAI : la liste des modèles ChatGPT pour l'API

L'API d'OpenAI est propulsée par une série de modèles divers offrant différentes capacités et points de prix. Que vous ayez besoin de comprendre et générer du langage naturel, d'écrire du code, de générer des images à partir de descriptions en langage naturel, ou de convertir de l'audio en texte, OpenAI a un modèle pour vous. Dans cet article, nous allons faire un tour d'horizon des modèles disponibles à travers l'API OpenAI.

GPT-4 Limited beta

Le modèle GPT-4 représente la dernière avancée d'OpenAI en matière d'intelligence artificielle. Il s'agit d'un modèle en version bêta limitée, améliorant les performances du GPT-3.5. Ce modèle est capable de comprendre et de générer à la fois du langage naturel et du code. Il est également optimisé pour le chat, mais fonctionne bien pour les tâches traditionnelles de complétion.

Deux versions de ce modèle sont disponibles :

gpt-4 : Il s'agit du modèle de base GPT-4 qui est mis à jour avec les dernières itérations du modèle.
gpt-4-32k : Il offre les mêmes capacités que le modèle de base gpt-4, mais avec 4 fois plus de contexte.

Il est à noter que pour beaucoup de tâches de base, la différence entre les modèles GPT-4 et GPT-3.5 n'est pas significative. Cependant, dans des situations de raisonnement plus complexe, GPT-4 se montre beaucoup plus capable que n'importe lequel des modèles précédents.

GPT-3.5

Les modèles GPT-3.5 peuvent comprendre et générer à la fois du langage naturel et du code. Le modèle gpt-3.5-turbo est le plus performant et le plus économique de la famille GPT-3.5. Il a été optimisé pour le chat, mais fonctionne également bien pour les tâches traditionnelles de complétion.

Parmi les modèles GPT-3.5, on retrouve :

gpt-3.5-turbo : Il est optimisé pour le chat et coûte 1/10ème du coût du modèle text-davinci-003.
gpt-3.5-turbo-16k : Il offre les mêmes capacités que le modèle standard gpt-3.5-turbo, mais avec 4 fois plus de contexte.

OpenAI recommande l'utilisation du modèle gpt-3.5-turbo en raison de son coût inférieur et de ses performances améliorées.

DALL·E Beta

DALL·E est un système d'intelligence artificielle qui peut créer des images réalistes à partir d'une description en langage naturel. Il peut créer une nouvelle image avec une certaine taille, modifier une image existante ou créer des variations d'une image fournie par l'utilisateur.

Whisper Beta

Whisper est un modèle de reconnaissance vocale à usage général. Il est entraîné sur un grand ensemble de données audio diverses et est également un modèle multi-tâches qui peut effectuer une reconnaissance vocale multilingue ainsi qu'une traduction vocale et une identification de la langue. Il est disponible sur l'API sous le nom whisper-1.

GPT-3

Les modèles GPT-3 sont capables de comprendre et de générer du langage naturel. Bien qu'ils aient été supplantés par les modèles de génération GPT-3.5 plus puissants, les modèles de base GPT-3 d'origine (Davinci, Curie, Ada et Babbage) sont actuellement les seuls modèles disponibles pour le fine-tuning. Chacun de ces modèles a ses propres caractéristiques et avantages, comme indiqué dans le tableau ci-dessous :

Modèle	Description	Tokens max	Données d'entraînement
text-curie-001	Très capable, plus rapide et moins coûteux que Davinci.	2,049 tokens	Jusqu'à octobre 2019
text-babbage-001	Capable de tâches simples, très rapide, et moins coûteux.	2,049 tokens	Jusqu'à octobre 2019
text-ada-001	Capable de tâches très simples, généralement le modèle le plus rapide de la série GPT-3, et le moins coûteux.	2,049 tokens	Jusqu'à octobre 2019
davinci	Modèle GPT-3 le plus capable. Peut réaliser n'importe quelle tâche que les autres modèles peuvent faire, souvent avec une qualité supérieure.	2,049 tokens	Jusqu'à octobre 2019
curie	Très capable, mais plus rapide et moins coûteux que Davinci.	2,049 tokens	Jusqu'à octobre 2019
babbage	Capable de tâches simples, très rapide, et moins coûteux.	2,049 tokens	Jusqu'à octobre 2019
ada	Capable de tâches très simples, généralement le modèle le plus rapide de la série GPT-3, et le moins coûteux.	2,049 tokens	Jusqu'à octobre 2019

Chacun de ces modèles présente une combinaison unique de capacités, de vitesse et de coût, ce qui permet une flexibilité dans le choix du modèle le mieux adapté à vos besoins spécifiques.