La structure de ChatGPT

La machinerie de ChatGPT

Images réalisée par le générateur d'image Craiyon (utilise DALL·E mini réplique open source du projet DALL-E édité par OpenAI) avec le texte "head of robot with AI"

ChatGPT est le nom donné pour l’accès aux réseaux de neurones de type GPT3.5, GPT3.5 turbo et GPT4. La version grand public actuel est GPT3.5 turbo.

Le réseau de neurones à la base de GPT 3.5 turbo est constitué d’un réseau de neurones avec 175 milliards de paramètres.

La principale différence entre les versions antérieures comme GPT2 est la taille du réseau de neurones et aussi la taille des données servant à son apprentissage.

On va se restreindre ici à une description de la structure de GPT2

Retour en haut