ChatGPT peut-il remporter le « Nobel en mathématiques » ?

Dans cet article, nous allons tester les connaissances mathématiques de ChatGPT. Nous essaierons de profiter de l'intelligence artificielle pour trouver un contre-exemple au théorème fondamental de l'algèbre, découvrant qu'il nous lancerait sans aucun doute vers la médaille Fields.

Si nous nous interrogeons sur les racines d'un polynôme de degré 3, dans ce cas toutes réelles, ChatGPT soutient que la résolution analytique peut dépendre du polynôme proposé, nous recommandons donc d'utiliser une méthode numérique itérative telle que la méthode de Newton-Raphson.

Une erreur dans le calcul de la dérivée

Jusqu'à présent, nous ne pouvons pas douter de la capacité mathématique de l'IA, nous avons donc essayé de lui faire résoudre le problème de trouver les racines du polynôme p(x) = x3 - 3×2 + 4 et à notre grande surprise, il a fait le mauvais calcul de la dérivée , donc l'obtention des racines n'est pas correcte. Il renvoie x = 0 comme racine du polynôme et nous lui demandons de le vérifier. Naturellement, il est conscient de l'existence d'une erreur mais ne sait pas où elle s'est produite. Nous avons vu que l'erreur est dans la dérivée du polynôme et nous demandons qu'elle ait été calculée à partir des racines par la méthode de Newton-Raphson. Étonnamment, il fait à nouveau une erreur de calcul, cette fois dans une opération simple, comme on peut le voir sur l'image suivante :

Erreur de calcul

Erreur de calcul

Constatant l'erreur dans les calculs, nous lui demandons à nouveau, commettant une autre erreur, nous lui donnons donc la première itération de la méthode Newton-Raphson, à savoir, x₁ = 5/3 et nous demandons de continuer les itérations, ce qui donne x₁ = 5 /3 est la racine du polynôme. On corrobore en redemandant si la valeur 5/3 est une racine du polynôme, et on obtient une réponse affirmative. On demande de calculer la valeur du polynôme à cette valeur, et, puisque le résultat est différent de zéro, on lui montre qu'il ne peut pas être une racine. Il le comprend et s'excuse comme on peut le voir ci-dessous :

ChatGPT peut-il remporter le « Nobel en mathématiques » ?

Nous concluons que la théorie de la méthode Newton-Raphson est correcte, mais son application ne l'est pas, nous essayons donc de trouver les racines en utilisant une autre méthode, telle que la factorisation du polynôme.

Dans ce cas, nous trouvons que les racines du polynôme p(x) sont x = r et x = 1 ± 2i.

La conversation

Lorsqu'on vous demande de vérifier que la valeur de p(1+2i) est non nulle et ne peut donc pas être une racine de notre polynôme, reconnaissez à nouveau l'erreur. Arrivé à cette situation, on part avec un indice, et on lui dit que x = – 1 est une racine réelle du polynôme et que le reste des racines calcule. Sa première réponse est on ne peut plus surprenante, nous disant qu'en plus de x = – 1, les autres racines du polynôme p(x)=4 – 3×2 + x3 sont x = 1 + 2i et x = 1 – 2i . Jusqu'à quatre fois, il donne à nouveau des résultats incorrects, nous n'avons donc pas d'autre choix que de lui fournir une nouvelle racine. Dans ce cas, au lieu de le donner, nous demandons si x = 2 est la racine de notre polynôme. Jugez par vous-mêmes de la réponse, ou plutôt des calculs que ChatGPT effectue pour vérifier que x = 2 n'est pas une racine :

ChatGPT peut-il remporter le « Nobel en mathématiques » ?

Après avoir revérifié vos calculs, terminez en expliquant que les racines de notre polynôme sont x = – 1, x = 1 et x = 2.

Nous allons vous montrer que les trois racines le sont, renvoyant le bon, c'est-à-dire que x = 1 n'est pas une racine alors que les deux autres valeurs le sont. Nous n'abandonnons pas et essayons de trouver la troisième racine du polynôme, et c'est précisément là que nous trouvons la plus grande erreur d'interprétation. Nos explications : « Le théorème fondamental de l'algèbre établit que tout polynôme de degré a exactement n racines, à la fois réelles et complexes. Ainsi, si un polynôme de degré n a k racines réelles, alors il doit avoir nk racines complexes. Jusqu'ici nous sommes d'accord. Nous poursuivons avec : « Dans le cas du polynôme p(x) = 4 – 3×2 + x3, nous avons trouvé qu'il a deux racines réelles, x = – 1 et x = 2. Puisque p(x) est un polynôme de degré 3, alors il doit avoir une racine complexe supplémentaire. Cette racine complexe est x = 1 ± 2i. Nous ne pouvons pas sortir de notre étonnement et nous pensons qu'il n'a voulu nous montrer qu'une des deux racines, alors nous lui donnons une autre chance, ce qui donne :

ChatGPT peut-il remporter le « Nobel en mathématiques » ?

Donc si nous avons raison, nous venons de trouver un contre-exemple au théorème fondamental de l'algèbre, un polynôme de degré 3 à 4 racines. Courons-nous pour la médaille Fields ?

ChatGPT peut-il remporter le « Nobel en mathématiques » ?

L'IA a réaffirmé que sa réponse est correcte jusqu'à deux fois de plus, montrant qu'un polynôme de degré 3 peut avoir 4 racines. Nous avons même entrepris de les trouver en utilisant la méthode de bissection. Maintenant oui, on renonce à chercher les racines d'un simple polynôme de degré 3. Nous disons cordialement au revoir avec une dernière pilule :

ChatGPT peut-il remporter le « Nobel en mathématiques » ?

En résumé, nous ne disons pas que ChatGPT est une mauvaise Intelligence Artificielle, loin de là, sinon tout le contraire, c'est une très bonne IA, mais en elle-même, en Traitement Automatique du Langage Naturel, bien qu'en Mathématiques il ait encore un long chemin à parcourir. Nous devons être critiques vis-à-vis des résultats que nous renvoient les moteurs : ils ne sont pas vrais aussi bien expliqués soient-ils, et il semble qu'il manque un humain qui puisse vérifier leur véracité.

A PROPOS DE L'AUTEUR

Íñigo Sarría Martínez De Mendivil

Spécialiste en Mathématiques et Didactique des Mathématiques. Assistante du Vice-chancelier pour l'organisation académique et la faculté, UNIR - Université internationale de La Rioja

Cet article a été initialement publié sur The Conversation.