Que signifie ChatGPT ?
ChatGPT (Chat Generative Pre-trained Transformer) est un modèle complexe d’apprentissage automatique capable d’effectuer des taches de génération de langage naturel (NLG) avec un tel niveau de précision que le modèle peut passer un test de Turing.
ChatGPT a été entra?né sur des quantités massives de données non étiquetées extraites d’internet avant 2022. Le modèle est continuellement contr?lé et affiné pour des taches linguistiques spécifiques à l’aide d’ensembles de données supplémentaires étiquetés par des humains.
Les taches pour lesquelles ChatGPT excelle sont les suivantes :
- Fournir des réponses à des questions ;
- Compléter un texte ou une phrase donnée ;
- Rédiger des contenus de fiction et de non-fiction à partir de messages-guides ;
- Produire des réponses de chatbot semblables à celles d’un humain ;
- Générer du code informatique ;
- Traduire le texte d’une langue à une autre ;
- Effectuer des calculs ;
- Résumer un texte donné ;
- Classer un texte en différentes catégories ;
- Analyser le sentiment d’un texte ;
- Générer du texte qui résume des données dans des tableaux et des feuilles de calcul ;
- Répondre à l’entrée de l’utilisateur d’une manière conversationnelle.
ChatGPT est construit sur un grand modèle de langage (LLM) appelé GPT-3 (Generative Pre-trained Transformer 3). Un LLM est un type de réseau neuronal profond qui utilise des milliards de paramètres et est entra?né avec des pétaoctets de données.
Le modèle a été développé par OpenAI, une société de recherche fondée par Elon Musk.
Techopedia explique ChatGPT
Techniquement, ChatGPT peut être considéré comme un type d’IA générative. Une fois entra?né, un modèle d’IA générative peut produire des résultats qui sont similaires – mais pas identiques – aux données d’entra?nement.
Comment ChatGPT a-t-il été formé ?
Les scientifiques des données et les ingénieurs en apprentissage automatique ont utilisé l’apprentissage semi-supervisé pour former ChatGPT.
Les algorithmes d’apprentissage semi-supervisé sont formés sur des ensembles de données partiellement étiquetés ; certains points de données sont étiquetés, d’autres non. Le modèle utilise les données étiquetées pour prédire la sortie des données non étiquetées.
Selon l’OpenAI, les scientifiques ont rassemblé l’énorme quantité de données non étiquetées nécessaires à l’apprentissage du LLM en fouillant sur l’internet. Ils les ont complétées par des sources textuelles qui étaient soit dans le domaine public, soit mises à la disposition des chercheurs et éventuellement des gouvernements.
OpenAI n’a pas révélé exactement comment elle a pu étiqueter les immenses ensembles de données nécessaires pour affiner le modèle, mais on sait qu’elle a externalisé une partie de l’étiquetage, et il est probable qu’elle a également tiré parti de plates-formes de crowdsourcing comme le Mechanical Turk d’Amazon.
ChatGPT utilise des messages-guides pour générer des réponses plus précises et plus pertinentes à un large éventail d’entrées et il est continuellement perfectionné grace aux messages-guides des utilisateurs qui sont pertinents pour une tache spécifique à accomplir.
Le processus consiste à donner au modèle une requête et à lui permettre de générer une réponse. La sortie générée est ensuite évaluée par un évaluateur humain, et le modèle est ajusté en fonction du retour d’information. Le processus d’ajustement est répété jusqu’à ce que les résultats du modèle soient acceptables.
C’est pourquoi il est important que les utilisateurs qui interagissent avec ChatGPT fournissent un retour d’information sur la qualité des résultats du modèle. En évaluant les résultats du modèle et en donnant leur avis, les utilisateurs peuvent aider à affiner le modèle et contribuer à son développement et à son amélioration continus.
ChatGPT et l’IA responsable
L’IA responsable est un cadre de gouvernance qui vise à rendre les modèles d’IA complexes comme ChatGPT plus explicables et donc plus dignes de confiance. L’OpenAI prend plusieurs mesures pour s’assurer que ChatGPT soutient le concept d’IA responsable.
- Les chercheurs et les développeurs de l’OpenAI cherchent des moyens de rendre ce modèle d’apprentissage profond plus transparent et essaient d’être aussi francs que possible sur les capacités, les limites et les abus potentiels du modèle.
- Les scientifiques des données d’OpenAI examinent continuellement les commentaires des utilisateurs et ont placé des humains dans la boucle (HITL) pour éliminer les biais dans leurs données d’entra?nement.
- Les ingénieurs de l’OpenAI surveillent en permanence les requêtes des utilisateurs de ChatGPT et les résultats du modèle pour s’assurer qu’il est utilisé de manière responsable.
ChatGPT et l’éducation
La dernière version de ChatGPT produit un texte tellement humain que les éducateurs ont tiré la sonnette d’alarme quant à l’utilisation abusive du modèle par les élèves. En réaction, certaines écoles ont carrément interdit ChatGPT. D’autres testent des outils de lutte contre le plagiat con?us pour identifier statistiquement les filigranes linguistiques des modèles.
OpenAi, par exemple, offre actuellement à ses membres un outil gratuit de lutte contre le plagiat appelé AI classifier. Selon le site web d’OpenAI, l’outil fonctionne mieux lorsque le contenu dont l’originalité est évaluée compte au moins 250 mots et est écrit par un adulte parlant anglais.
Les partisans de l’utilisation de ChatGPT en classe reconnaissent la valeur des outils anti-plagiat, mais affirment également que ce type d’intelligence artificielle (IA) n’est pas près de dispara?tre. Au lieu d’en interdire l’utilisation, il faudrait apprendre aux élèves à utiliser l’outil de manière éthique, et les éducateurs devraient utiliser ce type d’intelligence artificielle pour enseigner l’esprit critique.
Utilisations professionnelles de ChatGPT
ChatGPT est utilisé comme un outil d’intelligence augmentée pour une grande variété de taches professionnelles. Il est actuellement utilisé pour
- Automatiser le processus de création de contenu pour les posts sur les médias sociaux, les articles de sites web et les descriptions de produits ;
- Créer des chatbots conversationnels en contact avec les clients, capables de sortir du script ;
- Résumer et catégoriser les commentaires des clients provenant de plusieurs canaux ;
- Traduire des rapports commerciaux et des produits marketing d’une langue à l’autre ;
- Rédiger des codes informatiques standard et des scripts génériques ;
- Traduire en texte les informations contenues dans un tableau ou une feuille de calcul ;
- Créer des chatbots qui soutiennent l’apprentissage juste à temps pour les programmes de formation interne ;
- Rédiger des méta-descriptions et suggérer des synonymes pour les mots-clés de référencement.
Concurrents de ChatGPT
Google Bard – un service d’IA conversationnelle qui fournit des réponses précises et actualisées aux questions en regroupant des informations provenant d’Internet. Bien que l’on ne sache pas exactement en quoi le service de chatbot de Google sera différent de ChatGPT, les experts du secteur pensent que la différence entre BARD et ChatGPT résidera dans le fait qu’il peut accéder à des informations actuelles sur Internet, alors que ChatGPT n’a accès qu’aux informations publiées avant 2022.
Facebook Blender – un grand modèle linguistique développé par Facebook AI. Blender est capable d’effectuer diverses taches linguistiques, notamment de répondre à des questions, de générer du texte et de résumer de longs documents.