Pourquoi se donner la peine si le ChatGPT peut écrire pour nous ? Imagine que tu entres soudain sur un site Internet et que la quasi-totalité de ses articles soient écrits avec ChatGPT. Que dirais-tu de cela ? La voie de la facilité est quelque chose que beaucoup sont prêts à prendre et qui, le plus souvent, représente une ascension rapide avec une chute plus rapide. Maintenant qu'ils prétendent pouvoir détecter le texte généré par ChatGPT, nous verrons combien de temps durera cette sortie rapide.
Et nous disons cela parce que nous avons vu et entendu parler de trop de personnes qui se servent de cette technologie pour ne rien faire ou pour faire le strict minimum. L'intelligence artificielle est une technologie qui devrait nous soutenir, elle devrait être notre copilote au travail et rien de plus que cela. Il semble que trop de gens l'utilisent pour ne rien faire.
Les textes générés par l'IA sont de très bonne qualité, même si lorsqu'ils entrent dans le détail de sujets plutôt simplistes, on commence à voir quelques erreurs majeures. Mais, par exemple, lorsqu'il s'agit de détecter des travaux de classe générés par ChatGPT ou un humain, cela semblait impossible.
Cependant, d'après ce que nous pouvons voir sur Gizmodo, la situation est sur le point de changer. Il s'avère que des chercheurs de l'Université du Kansas ont publié une nouvelle étude consacrée à ce sujet compliqué. Nous pouvons y voir comment ils ont entraîné un algorithme qui est capable de détecter presque tous ou la plupart des textes scientifiques créés par ChatGPT.
Détection partielle ou totale des textes générés par ChatGPT.
L'algorithme a été entraîné sur des articles scientifiques rédigés par des humains. Après avoir inclus ces données dans ChatGPT, l'IA a généré 128 articles qui comportaient plus de 1200 paragraphes sans aucune signification scientifique. Ces données ont été utilisées par les chercheurs pour générer leur algorithme et détecter le contenu créé avec l'outil.
Les chercheurs ont trouvé quelques indices qui leur permettent de détecter tout texte généré par l'IA et ceux qui sont écrits par des humains. En général, les gens écrivent des paragraphes plus longs et utilisent un vocabulaire plus étendu. De plus, il est important d'ajouter qu'ils utilisent pas mal de mots tels que “Bien que”, “Mais”, “Aussi”, “Cependant”, etc. Un autre point sur lequel l'IA échoue souvent est la façon dont elle cite des références ou commente le travail d'autres personnes.
Une fois l'algorithme prêt à fonctionner, il était temps de le tester. On lui a donné 30 articles écrits par des humains et deux fois plus d'articles écrits par ChatGPT, tous avec 1200 paragraphes. L'algorithme a pu détecter tous les articles écrits par l'IA. Pour les paragraphes individuels, il a pu en détecter 91 %, bien que ce taux soit encore considérablement élevé.
Application de cet algorithme à d'autres secteurs
Il s'agit ici de détecter des textes scientifiques, n'est-ce pas ? Cependant, les chercheurs ont déclaré qu'il était possible de l'utiliser dans d'autres domaines. Il n'est pas capable pour l'instant de corriger des documents académiques quels qu'ils soient. Cependant, ce serait un concept qui pourrait devenir la base d'un système plus complexe qui pourrait être alimenté par différentes données pour détecter tout type de contenu généré par l'IA.
Évidemment, l'évolution constante de l'intelligence artificielle rendrait la détection de texte ou de tout autre contenu de plus en plus complexe. Mais logiquement, tout comme cela peut évoluer, les algorithmes qui seraient chargés de détecter ce type de contenu peuvent également évoluer.
Il ne faut pas oublier autre chose, l'Union européenne va appliquer une loi pour que les contenus générés par l'IA soient étiquetés. Chaque image générée par l'intelligence artificielle devra avoir une “signature cryptographique” qui ne serait pas visible pour identifier l'image.
À l'heure actuelle, on ne sait pas ce qui va se passer. Une chose est sûre, les sites Web qui sont générés ne serait-ce qu'à 10 % par ChatGPT ou les chaînes entières créées à l'aide de l'intelligence artificielle risquent de voir leurs jours comptés.
Il est possible que les grandes entreprises ne permettent pas à ce type de contenu de prendre le pas sur celui des utilisateurs. Spotify supprime déjà les chansons générées par l'IA, Google fera probablement de même, et n'oublions pas que YouTube leur appartient. Twitch a déjà bloqué la chaîne Rubius en se basant à 100 % sur l'intelligence artificielle et nous pourrions continuer encore un moment à en parler.