Image d'en-tête qui présente un ordinateur et un processeur pour illustrer un article sur la fiabilité des détecteurs d'IA

Les Intelligences Artificielles (IA) ont fortement progressé ces dernières années, et certaines d’entre elles ont fait la une des journaux à plusieurs reprises. Chat-GPT d’Open AI est sans aucun doute l’IA générative de textes la plus connue et la plus utilisée actuellement. Avec un niveau de justesse et de compétence accru, l’utilisation de ces outils s’est généralisée au point de susciter la méfiance dans certains secteurs d’activité. Ainsi, distinguer l’humain de l’Intelligence Artificielle est devenue plus compliqué, c’est la raison pour laquelle le web a vu naître les premiers détecteurs d’IA. Leur promesse est simple : déterminer si un texte a été rédigé par un humain ou par une IA. 

De façon très légitime, on est en droit de se questionner sur la fiabilité réelle de ces outils. Peut-on détecter la production d’une IA plutôt que celle d’un humain, quand il s’agit de l’écriture ? 

Nous allons tenter de répondre à cette question au cours de l’article qui suit ! 

Le fonctionnement des détecteurs d’IA générative de textes 

Qu’est-ce qu’une Intelligence Artificielle générative de textes ? 

L’Intelligence Artificielle (IA)  n’est pas une nouveauté, même si le traitement médiatique le laisse parfois penser.

➡️ En 1950 déjà, Alan Turing (plutôt réputé pour sa machine de décodage ENIGMA) publiait d’ores et déjà le texte « Computing Machinery and Intelligence » (les machines ordinatrices et l’intelligence). 

Une IA a historiquement pour but de se rapprocher de l’intelligence humaine grâce aux capacités des machines. Le Parlement Européen la définit comme le fait de : « reproduire des comportements liés aux humains, tels que le raisonnement, la planification et la créativité ». 

Avec le progrès technique, les IA ont connu un certain bon qui les rend désormais performantes dans de très nombreux domaines. 

Ici, nous allons uniquement nous intéresser aux IA génératives de textes, celles qui peuvent produire des écrits suite à un script envoyé sur l’outil en question. 

Les plus connues d’entre elles sont Chat-GPT d’Open AI et Bard de Google. 

Le principe est simple : vous leur demandez un texte sur un sujet précis, et elle s’exécute, en quelques secondes seulement. 

Ces récentes années, les dernières versions de ces IA ont fait beaucoup de progrès au point de venir parfois titiller le travail d’un humain en termes de justesse orthographique et de respect d’une consigne. 

Nous verrons cependant plus tard si ces textes s’avèrent véritablement infaillibles et utiles pour les humains. 

Comment fonctionnent les détecteurs d’IA pour les textes ? 

image qui récapitule les points principaux sur le fonctionnement des détecteurs d'Intelligence artificielle

Détecter une IA n’est pas seulement une problématique contemporaine, le fameux test de Turing possédait le même objectif. Avec la montée en capacité des Intelligences Artificielles, le besoin de mieux les détecter est devenu indispensable. 

Les détecteurs d’IA, en ce qui concerne les textes, fonctionnent grâce à deux techniques différentes : 

  • l’apprentissage automatique ; 
  • les processeurs de langage naturel (NLP). 

L’objectif du détecteur est de prédire la probabilité que le mot suivant corresponde au mot du modèle qu’il a défini. 

Ces deux techniques doivent lui permettre de repérer des modèles de langage, des similitudes en termes de syntaxe ainsi que le niveau de complexité prévisible. 

Plusieurs grandes thématiques sont scrutées par ces logiciels de détection d’IA : 

  • l’analyse linguistique : évaluation du sens sémantique et des répétitions dans le texte. 
  • la comparaison avec le texte d’une IA : le détecteur compare l’écrit avec un échantillon provenant d’une IA connue. S’il y a des similitudes, les probabilités sont renforcées. 
  • les classificateurs : modèle d’apprentissage qui va trier les données pour analyser les différents domaines linguistiques (vocabulaire, grammaire, style, etc.). 
  • le niveau de perplexité : l’IA utilise des textes existants, il peut être plus prévisible que si l’écrit est basé sur un niveau d’originalité élevé. 
  • l’éclatement : étude de la structure des phrases d’un texte. Une IA a tendance à présenter des structures similaires, spécialement en termes de longueur. Un humain alterne régulièrement entre phrases longues et courtes. 

De manière générale, ces détecteurs d’IA repèrent facilement les écrits répétitifs, le vocabulaire peu courant, les modèles prévisibles et les structures de phrase inchangées. 

➡️ Il est important de garder à l’esprit que les scores donnés relèvent de la probabilité

La méfiance à l’égard des textes générés par l’IA 

visuel qui reprend deux images d'un ordinateur et d'une personne avec un bras robotique pour récapituler les motifs de méfiance vis-à-vis de l'IA.

En quoi est-ce un risque d’utiliser une IA pour générer du contenu web ? 

Si autant d’outils de détection d’IA fleurissent sur internet, c’est que la génération artificielle d’un écrit peut susciter une certaine méfiance. 

→ Celle-ci ne va pas être la même d’un secteur à un autre. 

De manière générale, faire passer le texte d’une IA pour un écrit humain reste malhonnête. C’est la raison pour laquelle l’Union Européenne a planché sur une législation en la matière, avec la première loi pour contrôler l’utilisation de l’Intelligence Artificielle (AI Act). L’objectif de cette loi porte, en partie, sur la transparence concernant l’origine du contenu en ligne.

➡️ Du point de vue de la rédaction web et des pages internet de manière générale, le recours à l’IA peut être néfaste. 

Pour tout propriétaire de site internet, il peut être tentant de se passer des services d’un rédacteur web professionnel pour utiliser, par exemple, Chat-GPT. 

Cependant, l’IA utilise des textes existants pour générer son propre écrit. Imaginez que l’on se passe de l’humain pour le web, les contenus ne seraient qu’une agglomération de phrases provenant d’autres IA et la qualité des contenus serait nécessairement réduite. 

Cela même sans parler des défauts de l’IA quand il s’agit de produire une rédaction web équilibrée qui prend en compte le SEO, la cible, le ton de l’entreprise et l’originalité d’un écrit percutant. Certaines erreurs grossières peuvent, de la même façon, apparaître dans les documents produits. 

Comment maximiser l’utilisation d’une IA pour rédiger du contenu en ligne ?

Pour éviter ces désagréments et les effets négatifs de l’Intelligence Artificielle générative de textes, il faut garder en tête qu’il ne s’agit que d’un outil parmi d’autres. Certes, un outil particulièrement puissant, mais ce dernier doit rester au service d’un humain pour maximiser son efficacité. 

Plutôt que de lui demander la rédaction d’un texte complet peu ou pas optimisé, une IA comme Bard ou Chat-GPT peut être utilisée de multiples façons : 

  • générer une liste de mots-clés à insérer dans un article de blog ; 
  • proposer des exemples de structure pour conserver un article ou une page web bien équilibrée ; 
  • donner des idées d’articles pour un blog d’entreprise
  • résumer des documents ou des textes pour faciliter la recherche de sources et d’informations ; 
  • reformuler des passages problématiques ;
  • adapter un écrit à différents publics ; 
  • faire du brainstorming ; 
  • ajuster du contenu web à différents formats de communication digitale (réseaux sociaux, newsletters, mails, etc.) ; 
  • etc. 

Vous l’aurez compris, avec une utilisation mesurée, l’IA peut être un assistant à la rédaction web particulièrement puissant

Les outils de détection n’y verront que du feu si votre contenu en ligne a été produit par un humain (disons un rédacteur web SEO) qui s’est lui-même aidé de l’IA pour maximiser l’efficacité de son travail. 

La fiabilité des détecteurs d’IA : test avec 3 outils différents

Comme nous avons déjà pu le constater, les détecteurs d’IA fournissent une probabilité que le texte soit écrit ou non par un humain ou par une IA. Afin de se rendre compte de leur fiabilité, nous allons procéder à une expérience simple. 

➡️ Cette dernière a pour but de déterminer si oui ou non ces outils peuvent être fiables quand il s’agit de déterminer l’origine d’un écrit. 

Voici la nature et les différentes étapes de cette expérience : 

  1. Demander à Chat-GPT d’Open AI (version 3.5) d’écrire un texte. 
  2. Entrer ce texte sans modification dans 3 détecteurs d’IA différents, puis noter les scores « humain » ou « IA » en pourcentage. 
  3. Demander à Chat-GPT d’écrire une nouvelle version de ce texte en faisant cette fois attention à éviter les répétitions, les longueurs de phrase identiques et d’autres éléments qui peuvent être détectés par ces outils. 
  4. Réaliser un nouveau test sur les 3 mêmes outils. 

Étape n°1 : écriture du texte par une IA 

La requête initiale demandée à Chat-GPT est la suivante : « Peux-tu m’écrire un article de blog de 500 mots sur les détecteurs d’IA ? ».

Le texte, fourni en quelques secondes, contient un titre principal, une introduction, des sous-parties et une conclusion. 

Visuellement, l’Intelligence Artificielle générative de textes semble avoir fait le travail. 

Cependant, en y regardant de plus près, la moitié de l’écrit est hors sujet, car il évoque l’importance du détecteur d’IA pour rédiger des textes alors qu’il s’agit uniquement d’un outil de contrôle.

Cet élément ne vient pas contrarier l’expérience, mais laisse d’ores et déjà apparaître quelques défauts concernant la pertinence de ce type d’outil pour la rédaction web SEO. 

Étape n°2 : premier test sans modification sur les détecteurs d’IA

Pour cette seconde étape, je me suis contenté de taper sur Google « détecteur d’IA gratuit ». J’ai ici pris les outils les plus mis en avant par le moteur de recherche, à savoir : quillbot.com, smodin.io et plagiarismdetector.net

À noter qu’il existe des dizaines et des dizaines d’outils différents en ligne pour réaliser cette tâche. Certains d’entre eux sont complètement payants quand d’autres offrent une partie gratuite, pour un nombre de mots ou de caractères limités. 

Une fois le texte copié puis collé sans aucune modification dans ces détecteurs d’IA, voici les résultats donnés : 

Quillbot

Smodin

86,7 % de chance que le texte soit écrit par l’IA

Plagiarismdetector 

→ 3 outils et 3 résultats différents. Globalement, les outils semblent détecter l’apport de l’IA sauf le troisième qui ne repère aucune intervention de l’Intelligence Artificielle. 

Étape n°3 : nouvelle écriture du texte par l’IA en incluant des modifications pour tenter de leurrer les outils 

Pour cette troisième étape, voici la requête tapée dans Chat-GPT à la suite du texte donné lors de la première phase de l’expérience : « Peux-tu me réécrire cet article en évitant les répétitions, en variant les structures de phrase ainsi que le vocabulaire utilisé ? J’aimerais également que tu emploies un ton original pour que l’on ait l’impression que le texte soit écrit par un blogueur spécialisé dans les nouvelles technologies. »

➡️ Vous l’aurez compris, l’objectif est ici de tester les capacités de fonctionnement des détecteurs d’IA. 

Le texte obtenu est différent avec un ton moins froid. Cependant, un hors sujet reste présent, comme lors de la première écriture. 

Étape n°4 : deuxième test sur les trois mêmes outils 

Même tâche que lors de l’étape n°2. Voici les résultats donnés par nos trois détecteurs d’IA pour le nouveau texte de Chat-GPT version 3.5 : 

Quillbot

Smodin

72,5 % de chance que le texte soit écrit par l’IA

Plagiarismdetector 

→ Cette nouvelle version n’a provoqué aucune modification pour deux outils (Quillbot et Plagiarismdetector). 

Le détecteur d’IA de Smodin offre cependant un pourcentage moins élevé avec ces consignes différentes. La différence reste cependant faible, avec un écart de 14,2 points. 

Étape n°5 : les conclusions de l’expérience 

Pour ces conclusions, j’ai tenté de copier le deuxième texte dans d’autres outils. Voici les résultats obtenus : 

  • Zerogpt.net : 61,14 % humain et 38,86 % par une IA ;  
  • Neutralwriter.com : 30 % de probabilité que le texte soit écrit par un humain ; 
  • Smallseotools.com : 0.02 % écrit par une IA et 99,98 % écrit par un humain. 

Cette expérience est à prendre avec des pincettes et n’a aucune légitimité scientifique. Il conviendrait ici d’utiliser plusieurs IA génératives de textes, de tester plusieurs textes et de multiplier encore le nombre d’outils testés. 

Cependant, avec cette simple expérience, il est facile de se rendre compte que presque aucun détecteur d’IA ne donne le même résultat. Pour le deuxième texte, celui censé contourner quelques éléments de détection, on remarque que seulement la moitié des outils considère qu’il s’agit d’un texte écrit par une IA. 

➡️ Aucun outil ne donne le même score, ce qui peut être déroutant quand on recherche un détecteur d’IA fiable. 

Il y a fort à parier que, pour un court article, un détecteur gratuit sera utilisé, et on peut constater que la fiabilité n’est pas toujours au rendez-vous. 

Verdict : peut-on véritablement juger du recours à une IA générative de texte pour la rédaction d’un contenu ? 

Oui, et non.

Tout d’abord, nous l’avons vu en première partie, un détecteur d’IA délivre un score de probabilité. Même avec un score élevé, le résultat ne reste qu’une probabilité, et cela reste compliqué d’affirmer le recours à une IA si ce pourcentage n’est pas supérieur à 80 ou 90 % sur tous les outils. 

C’est une autre faiblesse des détecteurs d’IA : aucun outil ne donne le même score. D’un logiciel à un autre, on peut se retrouver avec un texte écrit par un humain à un écrit composé uniquement par une IA. 

D’un autre côté, certains détecteurs semblent mieux armés pour repérer l’utilisation d’une Intelligence Artificielle. De manière générale, si un outil vous donne 100 % d’écriture par une IA, il y a fort à parier que ce dernier ne soit pas très pertinent. Certains outils comme Smodin soulignent les passages problématiques et permettent une analyse plus fine du contenu. 

En conclusion, il faut choisir son détecteur d’IA avec soin et vérifier un texte sur plusieurs outils pour augmenter les chances de détecter l’écriture non humaine. Même avec ce procédé, vous ne pourrez jamais être sûr à 100 % de l’origine d’un texte, comme notre rapide test l’a démontré. 


➡️ Vous souhaitez un texte 100 % rédigé par un humain ? Chez ScribWeb, nous utilisons parfois l’IA pour des tâches annexes et préparatoires comme l’aide à la structuration ou la recherche de mots-clés.

Cependant, la rédaction se révèle effectuée en intégralité par mes soins. Cela me donne l’occasion de personnaliser l’écriture, la formulation, le ton et d’optimiser pour le SEO les écrits produits. L’objectif ? Prendre soin de votre vitrine en ligne !


Sources : 

Vous souhaitez partager cet article ?
Catégories : Blog

0 commentaire

Laisser un commentaire

Emplacement de l’avatar

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *