Que peut vraiment ChatGPT pour votre thèse ?

14 Fév 2023 | Mieux vivre sa recherche, Rédiger | 6 commentaires

Réussir sa thèse > Articles > Mieux vivre sa recherche > Que peut vraiment ChatGPT pour votre thèse ?

Difficile de passer à côté en ce moment, car tous les médias en parlent : l’ouverture d’un accès libre à  » l’agent conversationnel  » ChatGPT, créé par la société OpenAI, permet à tout un chacun d’avoir accès à un outil d’Intelligence Artificielle.

En tant que doctorant, doit-on ignorer cet outil ? Le critiquer ? Le craindre ? L’utiliser ?

Dans cet article, je vous propose un point de vue pratique suivi d’une réflexion plus générale sur le rôle de l’IA et ce qu’elle nous révèle de nous-mêmes.

Avant de répondre, un rappel : Qu’est-ce que ChatGPT ?

C’est, pour le dire simplement, un « robot » capable d’écrire des textes pour répondre à des questions qu’on lui pose. Il utilise un système basé sur l’intelligence artificielle (A.I.), c’est-à-dire qu’il apprend constamment et s’adapte à la demande de l’interlocuteur ; les réponses sont personnalisées et imitent le style d’un être humain de façon très pertinente. ll est disponible librement sur le site de la société OpenAI, qui actuellement est très souvent saturé… Cet outil est un précurseur mais d’autres suivront dans un avenir proche.

Si vous avez déjà essayé de parler avec chatGPT ou si vous avez vu des démonstrations, vous avez dû être surpris(e) par la qualité et le naturel stupéfiant des réponses apportées, ainsi que par quelque chose de troublant : la capacité créative de l’outil, qui peut inventer des textes de tous styles, sur toutes sortes de sujet : des textes structurés, comme mus par un raisonnement. Il semble même avoir de l’humour ! Et dans les prochaines versions, les résultats seront encore plus étonnants, vu que l’intelligence artificielle permet une amélioration continue de l’outil : elle « apprend ».

Nous avons donc là un agent artificiel qui comprend, qui apprend, qui crée.

C’est le début de la démocratisation d’une révolution technologique majeure, qui était utilisée dans l’industrie depuis quelques années.

Et pour vous, doctorant, que va-t-il se passer ?

Peut-être vous sentez-vous un peu mal à l’aise : chaque saut technologique apporte son lot de peurs : peur que l’humanité ait créé un outil qui la dépasse, donc incontrôlable (le mythe de l’apprenti sorcier), ou encore : peur de ne plus servir à rien, de ne plus avoir de place dans un monde où tout le travail est fait par les machines intelligentes.

J’espère que vous y verrez plus clair après avoir lu cet article ; mais commençons par nous débarrasser tout de suite d’une idée absurde relayée par certains médias…

Est-ce que chatGPT peut écrire ma thèse ?

Pas la peine de lancer un roulement de tambour et de faire durer le suspense, la réponse est tout simplement : non ! C’est rigoureusement impossible en l’état actuel des choses, et ce pour plusieurs raisons :

La longueur du texte : actuellement le modèle de langage GPT ne peut pas produire un texte structuré long, tout seul. Il est fait pour converser, beaucoup moins pour disserter. Sa mémoire de travail est limitée à quelques paragraphes ; et s’il se souvient des échanges précédents, il s’embrouille dès que la conversation devient longue et exige de se rappeler de tous les méandres par lesquels on est passé. Cet outil fonctionne très bien si on lui pose des questions précises et ponctuelles, et il y répond synthétiquement. Il faudrait lui poser une séquence structurée de questions précises et bien orientées pour lui faire écrire un texte argumenté de plusieurs pages (en mettant bout à bout ses réponses). Et si vous êtes capable de le guider de cette façon, c’est que vous avez le squelette très précis de votre texte, et que vous l’avez donc quasiment déjà écrit !

 

L’absence de sources ou références : ChatGPT utilise une multitude  de sources, qu’il sait trier et croiser, mais qu’il ne révèle pas. Sauf si on lui demande très expressément de citer une référence. Il faudrait donc être toujours derrière le robot pour lui demander de s’expliquer, si on veut produire un texte bien sourcé.

L’absence de travail de terrain : évidemment, le robot ne va pas faire de recueil de données en extérieur, de type entretiens qualitatifs. Bien sûr il analyse des milliers de données chargées dans sa base (actuellement ses archives s’arrêtent à l’année 2021), mais il ne collecte pas de données nouvelles pour répondre à votre question.

Son rapport biaisé à la réalité : pour vous jeunes chercheurs, voici donc le problème principal de chatGPT : il se trompe parfois ; mais, et c’est encore plus grave, il « baratine » aussi beaucoup. Commençons par les erreurs « involontaires » (enfin, le robot n’a pas de volonté, mais je ne vois pas comment dire autrement). L’outil n’est pas exempt d’erreurs factuelles et d’approximations : ne lui faites pas une confiance aveugle (pas plus qu’à un humain). Ce n’est pas le plus grave car tout le monde peut se tromper, et l’IA apprend ; donc l’agent conversationnel se corrige et s’améliore constamment.

Pour l’anecdote, un concurrent de chatGPT, l’agent conversationnel Bard de Google, a, lors d’une démonstration, fait une grosse bourde sur la date d’un événement scientifique (l’action Google a plongé en bourse suite à cette erreur !). Ces outils peuvent également avoir du mal à discerner des propos biaisés ou politisés, par exemple. Il leur manque… l’esprit critique.

Mais il y a plus grave que des erreurs ponctuelles : cet outil a été conçu pour s’adapter à son interlocuteur, donc son discours change en fonction de qui il a en face. C’est-à-dire… Qu’il présente les choses de façon à vous satisfaire ! Et c’est normal, car c’est ainsi qu’il a été entraîné.

Alors, s’il est vrai qu’aucune forme d’intelligence venant de ce bas monde ne peut prétendre détenir la vérité univoque et absolue, nous humains essayons de construire une vision cohérente, pleine de sens, et d’en informer nos contemporains. Pas chatGPT. Lui, il dit juste ce qu’il croit qu’on attend de lui, ce qui le rend parfois incohérent. Je ne pourrai pas mieux expliquer cela que cette vidéo, qui est de loin la plus claire et la plus pertinente pour démontrer ce point : https://youtu.be/JcFRbecX6bk

Devons-nous déduire que chatGPT est inutile pour le chercheur ? Pas exactement, et c’est à vous de lui trouver une utilisation pertinente, si vous aimez l’innovation ! Voici quelques pistes (et vous pouvez m’en donner d’autres en commentaires) :

Puis-je utiliser le chatGPT, actuellement, pour m’aider à rédiger ma thèse ?

Je parlerais ici seulement de l’aspect rédactionnel, et pas du traitement des données.

Le chatGPT et tout autre agent conversationnel à venir sont des outils, et comme tels, peuvent être utilisés avec profit.

La société OpenAI définit d’ailleurs son agent comme un assistant. Pas un rédacteur infaillible, ni un découvreur ; mais plutôt un bon technicien.

Et c’est la seule manière de voir les choses : un tel outil peut vous assister. Pourquoi ne pas en profiter ?

 

Quelques utilisations pratiques de l’IA en accès libre pour l’écriture de la thèse :

– Comme moteur de recherche (avec modération) : l’agent conversationnel est l’équivalent d’un interlocuteur bien renseigné, poli, agréable à fréquenter. Un ami pourrait aller faire quelques recherches en bibliothèque pour vous, mais chatGPT est … tellement plus rapide wink. Si vous lui posez une question précise, non polémique, il y répond parfaitement. C’est pratique. Mais il faut l’utiliser en complément avec d’autres moteurs de recherche plus classiques dès que vous pensez qu’il faut croiser les sources ou que le sujet est complexe.

– Comme secrétaire de rédaction : vous avez une lettre à écrire, et vous avez peur de passer trop de temps en procrastination et hésitation sur son contenu ? Demandez à chatGPT de faire le travail, en lui indiquant le ton que vous souhaitez donner à la lettre et qui est l’interlocuteur. Voilà. Vous venez de gagner une heure. Ou encore, vous bloquez sur un paragraphe à rédiger ; vous avez le contenu, l’argumentation en tête, mais vous n’arrivez pas à mettre ça en forme. Demandez à chatGPT de vous donner un coup de main. Cela peut vous débloquer, alors pourquoi pas ? Il agit alors comme un interlocuteur, vous pouvez le corriger, il met et remet en forme.

Souvenez-vous, plus les questions que vous lui poserez seront précises, mieux ce sera.

– Comme traducteur ou correcteur de texte : car il a une syntaxe impeccable.

Ces conseils pragmatiques étant posés, j’ai envie d’élargir la question. Car je pense qu’au-delà de ces outils, l’I.A peut nous aider sur un point bien plus essentiel : elle peut nous aider à prendre conscience de nos forces et de notre talent d’être humain.

Le chercheur humain a-t-il une valeur ajoutée par rapport à l’I.A ?

Nous avons vu les problèmes de la relation que l’IA entretient avec la « vérité » quand il s’agit de produire du discours. Ce sont des problèmes assez consistants, mais imaginons que l’on parvienne à paramétrer un outil d’IA pour éviter les biais des agents conversationnels : on aurait un chercheur « artificiel » vraiment sérieux qui cherche à croiser et confronter ses sources. Cela semble envisageable. Mais… Ce chercheur serait-il bon ?

 

Eh bien, cela dépend de ce que l’on entend par « bon ».

L’IA peut-elle trouver des explications nouvelles ? Peut-elle faire des découvertes ? Oui, car elle fait preuve de créativité. Le mathématicien Marcus du Sautoy dans son ouvrage « Le code de la créativité » note que les modèles  d’Intelligence Artificielle peuvent faire des découvertes mathématiques.

Mais, nuance-t-il, la créativité ne se résume pas au fait de fabriquer quelque chose de nouveau. La créativité, c’est la pulsion qui nous incite à créer quelque de nouveau, mais également de surprenant, et qui a de la valeur. La valeur et la surprise sont difficiles à obtenir, et sont proprement humaines. La créativité « artificielle » est donc limitée.

Qu’est-ce qui fait que votre thèse a de la valeur et qu’elle est étonnante pour la société humaine ? C’est une bonne question à se poser, et elle rejoint une question que je pose souvent aux doctorants en formation : « qu’est-ce qui t’étonne, dans le phénomène que tu étudies ? ». C’est à l’endroit où vous avez été surpris, étonné, que réside le coeur de votre travail.

Même si vous n’êtes pas Einstein, ce sera toujours infiniment plus facile pour vous de créer de la valeur que pour une IA.

Ce qui fait la valeur de la recherche effectuée par des humains

La période est intéressante, je pense, car elle va révéler et mettre en lumière ce que nous avons de plus, nous les humains, par rapport aux algorithmes ; elle va nous obliger à laisser de côté les textes attendus et médiocres, et à mettre en valeur notre singularité.

Si l’humain se trouve un jour placé en concurrence avec l’IA, alors un vieux mythe sera battu en brèche, à mon plus grand plaisir : le mythe du chercheur neutre, objectif.

Ce qui fait la spécificité de notre intelligence, et sa capacité à forger des éléments précieux et étonnants, c’est que notre cerveau fait intervenir des éléments émotionnels dans tout raisonnement.

En Occident (et singulièrement en France, pays de Descartes), une perception péjorative des émotions est profondément ancrée. Raison et émotion sont perçues comme opposées. L’émotion serait à l’origine de tous les biais, de tous les excès, de tous les préjugés. Cette vision confond le sentimentalisme niais avec la perception saine des émotions qui est un élément central de notre fonctionnement cognitif. Le chercheur en neuropsychologie Antonio Damasio a montré l’importance des émotions dans tout raisonnement humain ; sans émotion, aucune prise de décision n’est possible. La raison logique dépourvue de toute émotionnalité n’existe pas pour nous, humains. Si je sais discerner les informations apportées par mes émotions, ma capacité intellectuelle est potentialisée. Je commence à créer, c’est-à-dire à trouver/forger des choses étonnantes et précieuses. Tous les grands chercheurs ont été profondément portés et mus par leurs émotions au moment même de travailler (et non pas débordés par elles).

Les éléments émotionnels sont la source de la curiosité, qui nous pousse à aller voir là où on ne devrait pas ; de l’étonnement qui amène la remise en question ; du sentiment d’injustice, qui nous alerte sur ce qui dysfonctionne dans un système social ou épistémologique. L’émotion est aussi à la source de la prise de décision.

L’émotion mise en pensée est l’alpha et l’oméga de la créativité humaine, qui est, de ce fait, toujours plus brillante, essentiellement différente de la créativité artificielle.

L’émotion et la singularité de l’auteur dans un cadre universitaire doivent être reconsidérées dans les années à venir, par contraste avec les productions logiques et plates de l’IA.

Alors, jeunes chercheurs, je vous encourage à ne plus vous dissimuler derrière des textes attendus et scolaires qu’un robot habile pourrait fournir : découvrez plutôt le feu qui vous anime (la pulsion créative), et mettez-le à l’œuvre ; révélez votre capacité d’étonnement et d’émerveillement : elle vous guidera vers la vraie créativité, quel que soit votre domaine.  N’ayez plus peur de votre singularité.

Bien sûr, cette démarche devra être équilibrée par une rigueur intellectuelle accrue pour ne pas se mettre à produire des textes militants ou empreints d’un sentimentalisme malvenu ; utiliser correctement nos capacités humaines implique une grande lucidité ( j’explique ici comment atteindre une rigueur intellectuelle dans son travail).

En attendant, soyez certains que vous êtes le seul, la seule à pouvoir faire votre thèse avec brio et talent, et à insuffler une créativité inimitable à votre travail, aussi modeste qu’il vous paraisse !

Les commentaires sur l’article :

6 Commentaires

  1. kourouma

    exemple des thèses en publicité
    gouvernance publicitaire

  2. LI AR

    Autre note:

    Pour ce qui est des références, l' »ancien » ChatGPT (qui s’appuie sur GPT-3.5), celui qui est toujours gratuit aujourd’hui (~mid 2023), oui il faut faire attention qu’il les « hallucine » : il a compris la *structure* d’une référence : un nombre entre crochets, des auteurs, un titre, une conf/journal, etc. mais il génère ces différents champs avec du texte aléatoire (GPT n’est qu’un « perroquet stochastique »). Il peut se trouver que pour des références qu’il a vu des milliers de fois dans les données sur lesquelles il a été entraîné, ses probabilités l’amènent à répéter un texte qui existe vraiment, mais il est plus probable qu’il génèrera un truc un minimum différent (donc complètement faux lorsqu’il s’agit une référence, par exemple si les pages ou la conf ou les auteurs sont un peu différents de la vraie ref, on ne sera plus en mesure de la retrouver…). C’est la même chose d’ailleurs avec les URL qu’il fournit : elle sont syntaxiquement correctes, mais n’existent la plupart du temps pas… (*)

    Ça s’est un peu amélioré avec la version payante (GPT-4) et avec Bing Chat. Ce dernier fonctionnant d’une manière un peu différente : il reformule votre requête, la lance sur le moteur de recherche Bing, puis vous synthétise les X premiers résultats. Il fournit donc des liens vers des sites web valides, mais ne donnera probablement pas de références aux sens « Biblio scientifique »…

    Pour la recherche, il existe des outils un peu plus « spécialisés » (mais avec leurs propres limites) basés sur GPT :
    – Elicit : vous posez une « question scientifique » et il vous sort une liste de papiers correspondants, avec un résumé d’une ligne de l’abstract (principalement des papiers IEEE)
    – Consensus : vous posez une « question scientifique » (tendancieuse) et il vous répond s’il y a consensus ou débat sur la réponse suite à une « analyse » (avec toutes ses limites) des différents papiers sur le sujet
    – ResearchRabbit : système de recommandation de papiers, qui apprend vos préférences et vous envoie régulièrement des synthèses de papiers qui pourraient vous intéresser.

    Chacun a ses limites, mais peut être utile s’il est bien utilisé :)…

    (*) Un peu comme les mains dans DallE ou StableDiffusion, qui restent encore un des moyens « manuels » de détecter la génération artificielle d’un document.

    • Émilie Doré

      Vos remarques sont très utiles et complètent l’article. Je vous en remercie !

  3. LI AR

    Bonjour,
    Quelques commentaires :

    – ATTENTION : quand vous parlez de « l’IA en open source » notamment à propos de ChatGPT/OpenAI, vous êtes complètement dans le faux : le fait d’être *public* (par exemple, disponible à tout un chacun via un site web) n’a rien à voire avec l’*open source* (qui signifie que tout le monde a accès au code source du produit, ce qui n’est *absolument pas* le cas de ChatGPT: ni le code qui a permis de générer le modèle, ni le modèle lui-même ne sont disponibles ; on ne connaît même pas exactement les données qui ont été utilisées pour entraîner ce modèle !). C’est un produit qui tend plutôt à être *totalement fermé* que *totalement ouvert* !

    – Concernant les émotions et le fait qu’elles seraient à la base de tous nos comportements, je ne peux que vous inviter (ainsi que vos lecteurs intéressés) à lire les différents livres de Frans de Waal (« la dernière étreinte », « sommes nous trop bêtes pour comprendre l’intelligence des animaux ? », « l’âge de l’empathie »…), dont les recherches portent entre autres sur ce sujet et comportent des études incroyablement enrichissantes sur le rôle des émotions chez divers animaux, dont nos cousins les grands singes.

    – @Alcide Pour aller dans votre sens, une des premières chose que nous enseignions à nos élèves dans mon institution (ens. sup.) c’est qu’il est *indispensable* de savoir faire soi-même la tâche que l’on demande à un outil de faire, sinon c’est la porte ouverte aux plus grandes des catastrophes (ex: par flemmardise – ou incompétence ? -, des dizaines de milliers de développeurs ont recopié un morceau de code – le plus cité – sur StackOverflow ; or ce code est bugé, donc des dizaines de milliers de logiciels sont susceptibles de planter au moment où on l’attendra le moins et/ou d’être exploités par des personnes malveillantes). Pourtant, il faut savoir que l’informatique est un domaine où l’on prône l’utilisation d’outils pour automatiser des tâches… En effet, c’est un domaine où de nombreuses tâches sont très répétitives, or on sait bien que l’humain s’embête vite à répéter toujours les mêmes choses, ce qui est source de maintes erreurs. Mais beaucoup oublient qu’il faut être *maître des outils qu’on utilise* sinon c’est la porte ouverte à encore plus d’erreurs.
    Je pense à votre exemple de PowerPoint. Effectivement, c’est un gros travers que je constate beaucoup trop souvent : l’outil est facile à utiliser, donc tout le monde se croit-capable-de et fait des présentations ; malheureusement, la grande majorité des présentateurs n’a même pas idée des techniques de base de communication, ce qui résulte (au mieux) en des présentations barbantes…

    • Émilie Doré

      Bonjour, merci d’avoir relevé cette erreur sur l' »open source » ! Vous avez tout à fait raison, je corrige l’article dans ce sens.

  4. Alcide

    Pour ma part, plus je vois d’outils de ce type fleurir, plus je deviens minimaliste et fais confiance à mon corps, ses sens et à mon cerveau. J’avais déjà commencé avec des supports comme Powerpoint en refusant catégoriquement de l’utiliser. Le langage est largement assez riche pour créer des images mentales dans la tête du public. Il ne faut toutefois pas refuser le progrès (y compris celui qu’on utilise en l’oubliant: internet, ordi, etc.), mais plutôt de l’utiliser de façon systématiquement « complémentaire » , jamais « à la place de » l’humain et de ses facultés à l’état nu. Puis il y a aussi une dimension liée à l’estime personnelle dans la thèse : je veux qu’elle soit MON œuvre, pas celle d’outils qui réfléchissent à ma place. Et ça compte énormément dans le processus de satisfaction de soi, de construction de soi « au passage », sur le plan intellectuel. Et tant de choses à dire…. en gros il faut n’être ni trop technophile ni trop technophobe…

Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *