Kan ChatGPT vinde 'Nobel i matematik'?

I denne artikel skal vi teste den matematiske viden om ChatGPT. Vi vil forsøge at drage fordel af kunstig intelligens til at finde et modeksempel til Algebras grundlæggende sætning og opdage, at det utvivlsomt ville lancere os mod Fields-medaljen.

Hvis vi spørger om rødderne af et polynomium af grad 3, i dette tilfælde alle reelle, argumenterer ChatGPT for, at den analytiske opløsning kan afhænge af det foreslåede polynomium, så vi anbefaler at bruge en iterativ numerisk metode, såsom Newton-Raphson-metoden.

En fejl i beregningen af ​​den afledte

Indtil videre kan vi ikke tvivle på AI'ens matematiske evner, så vi forsøgte at få det til at løse problemet med at finde rødderne af polynomiet p(x) = x3 – 3×2 + 4, og til vores overraskelse lavede den den forkerte beregning af derivatet, så det er ikke korrekt at få rødderne. Det returnerer x = 0 som roden af ​​polynomiet, og vi beder det kontrollere det. Den er naturligvis klar over, at der findes en fejl, men ved ikke, hvor den er opstået. Vi har set, at fejlen er i den afledede af polynomiet, og vi beder om, at den er blevet beregnet ud fra rødderne gennem Newton-Raphson-metoden. Overraskende nok laver den en beregningsfejl igen, denne gang i en simpel operation, som vi kan se på følgende billede:

Fejlberegning

Fejlberegning

Når vi bemærker fejlen i beregningerne, spørger vi ham igen og begår endnu en fejl, så vi giver ham den første iteration af Newton-Raphson-metoden, nemlig x₁ = 5/3, og vi beder om at fortsætte gentagelserne, hvilket resulterer i x₁ = 5 /3 er roden af ​​polynomiet. Vi bekræfter ved at spørge igen, om værdien 5/3 er en rod af polynomiet, og vi får et bekræftende svar. Vi beder om at beregne værdien af ​​polynomiet ved denne værdi, og da resultatet er forskelligt fra nul, viser vi det, at det ikke kan være en rod. Han forstår det og undskylder, som vi kan se nedenfor:

Kan ChatGPT vinde 'Nobel i matematik'?

Vi konkluderer, at teorien om Newton-Raphson-metoden er korrekt, men dens anvendelse er det ikke, så vi forsøger at finde rødderne ved hjælp af en anden metode, såsom faktorisering af polynomiet.

I dette tilfælde finder vi, at rødderne af polynomiet p(x) er x = r og x = 1 ± 2i.

Samtalen

Når du bliver bedt om at verificere, at værdien af ​​p(1+2i) er ikke-nul og derfor ikke kan være en rod af vores polynomium, skal du igen anerkende fejlen. Når vi kommer til denne situation, går vi med en ledetråd, og vi fortæller ham, at x = – 1 er en reel rod af polynomiet, og at resten af ​​rødderne beregner. Hans første svar kunne ikke være mere overraskende og fortæller os, at ud over x = – 1 er de andre rødder af polynomiet p(x)=4 – 3×2 + x3 x = 1 + 2i og x = 1 – 2i . Op til fire gange giver det forkerte resultater igen, så vi har intet andet valg end at give det en ny rod. I dette tilfælde spørger vi i stedet for at give det, om x = 2 er roden til vores polynomium. Bedøm selv svaret, eller rettere sagt, de beregninger, som ChatGPT udfører for at kontrollere, at x = 2 ikke er en rod:

Kan ChatGPT vinde 'Nobel i matematik'?

Efter at have kontrolleret dine beregninger igen, afslutte med at forklare, at rødderne af vores polynomium er x = – 1, x = 1 og x = 2.

Vi vil vise dig, at alle tre rødder er, hvilket returnerer det rigtige, det vil sige, x = 1 er ikke en rod, mens de to andre værdier er det. Vi giver ikke op og forsøger at finde polynomiets tredje rod, og det er netop der, vi finder den største fejlfortolkning. Vores forklaringer: "Algebras grundlæggende sætning fastslår, at hvert polynomium af grad har nøjagtig n rødder, både reelle og komplekse. Således, hvis et polynomium af grad n har k reelle rødder, så skal det have nk komplekse rødder. Indtil videre er vi enige. Vi fortsætter med: “I tilfældet med polynomiet p(x) = 4 – 3×2 + x3, har vi fundet ud af, at det har to reelle rødder, x = – 1 og x = 2. Da p(x) er en polynomium af grad 3, så skal det have en yderligere kompleks rod. Denne komplekse rod er x = 1 ± 2i." Vi kan ikke komme ud af vores forbavselse, og vi tror, ​​at han kun ville vise os en af ​​de to rødder, så vi giver ham en chance til, hvilket resulterer i:

Kan ChatGPT vinde 'Nobel i matematik'?

Så hvis vi har ret, har vi netop fundet et modeksempel til Algebras grundlæggende sætning, et polynomium af grad 3 med 4 rødder. Kører vi til Fields-medaljen?

Kan ChatGPT vinde 'Nobel i matematik'?

AI bekræftede, at hendes svar er korrekt op til to gange mere, hvilket viser, at et grad 3 polynomium kan have 4 rødder. Vi satte os endda for at finde dem ved hjælp af bisektionsmetoden. Nu ja, vi opgiver at lede efter rødderne til et simpelt grad 3 polynomium. Vi siger hjerteligt farvel med en sidste pille:

Kan ChatGPT vinde 'Nobel i matematik'?

Som en sidste opsummering siger vi ikke, at ChatGPT er en dårlig kunstig intelligens, langt fra, hvis ikke bare det modsatte, er det meget god AI, men i sin egen, i Natural Language Processing, selvom det i matematik stadig har en lang vej at gå. lær. Vi skal være kritiske over for de resultater, som motorerne returnerer til os: de er ikke sande, uanset hvor godt forklaret de er, og det ser ud til, at der mangler et menneske, som kan bekræfte deres sandhed.

OM FORFATTEREN

Íñigo Sarría Martínez De Mendivil

Specialist i matematik og matematikdidaktik. Assistent for vicekansler for akademisk organisation og fakultet, UNIR – International University of La Rioja

Denne artikel blev oprindeligt publiceret på The Conversation.