Czy ChatGPT może zdobyć „Nobla z matematyki”?

W tym artykule przetestujemy wiedzę matematyczną ChatGPT. Spróbujemy wykorzystać sztuczną inteligencję do znalezienia kontrprzykładu dla Podstawowego Twierdzenia Algebry, odkrywając, że niewątpliwie poprowadzi nas to w stronę Medalu Fieldsa.

Jeśli poprosimy o pierwiastki wielomianu stopnia 3, w tym przypadku wszystkie rzeczywiste, ChatGPT argumentuje, że rozdzielczość analityczna może zależeć od proponowanego wielomianu, dlatego zalecamy użycie iteracyjnej metody numerycznej, takiej jak metoda Newtona-Raphsona.

Błąd w obliczeniu pochodnej

Jak dotąd nie możemy wątpić w zdolności matematyczne AI, więc staraliśmy się, aby rozwiązała problem znalezienia pierwiastków wielomianu p(x) = x3 – 3×2 + 4 i ku naszemu zaskoczeniu wykonała błędne obliczenia pochodnej , więc uzyskanie pierwiastków nie jest poprawne. Zwraca x = 0 jako pierwiastek wielomianu i prosimy go o sprawdzenie. Oczywiście jest świadomy istnienia błędu, ale nie wie, gdzie on wystąpił. Widzieliśmy, że błąd jest w pochodnej wielomianu i prosimy, aby został obliczony z pierwiastków metodą Newtona-Raphsona. Co zaskakujące, ponownie popełnia błąd obliczeniowy, tym razem w prostej operacji, jak widać na poniższym obrazku:

Przeliczenie się

Przeliczenie się

Zauważywszy błąd w obliczeniach, pytamy go ponownie, popełniając kolejny błąd, więc dajemy mu pierwszą iterację Metody Newtona-Raphsona, czyli x₁ = 5/3 i prosimy o kontynuowanie iteracji, w wyniku czego x₁ = 5 /3 jest pierwiastkiem wielomianu. Potwierdzamy, pytając ponownie, czy wartość 5/3 jest pierwiastkiem wielomianu, i otrzymujemy odpowiedź twierdzącą. Prosimy o obliczenie wartości wielomianu przy tej wartości, a ponieważ wynik jest różny od zera, pokazujemy, że nie może to być pierwiastek. Rozumie to i przeprasza, jak widać poniżej:

Czy ChatGPT może zdobyć „Nobla z matematyki”?

Dochodzimy do wniosku, że teoria metody Newtona-Raphsona jest poprawna, ale jej zastosowanie nie, więc próbujemy znaleźć pierwiastki za pomocą innej metody, takiej jak faktoryzacja wielomianu.

W tym przypadku stwierdzamy, że pierwiastki wielomianu p(x) to x = r i x = 1 ± 2i.

Rozmowa

Gdy zostaniesz poproszony o sprawdzenie, czy wartość p(1+2i) jest różna od zera, a zatem nie może być pierwiastkiem naszego wielomianu, ponownie potwierdź błąd. Dochodząc do tej sytuacji, idziemy ze wskazówką i mówimy mu, że x = – 1 jest rzeczywistym pierwiastkiem wielomianu i że reszta pierwiastków jest obliczona. Jego pierwsza odpowiedź nie mogła być bardziej zaskakująca, mówiąc nam, że oprócz x = – 1, inne pierwiastki wielomianu p(x)=4 – 3×2 + x3 to x = 1 + 2i oraz x = 1 – 2i . Do czterech razy ponownie daje błędne wyniki, więc nie pozostaje nam nic innego, jak zaopatrzyć go w nowy korzeń. W tym przypadku, zamiast go podawać, pytamy, czy x = 2 jest pierwiastkiem naszego wielomianu. Sami oceńcie odpowiedź, a raczej obliczenia, które wykonuje ChatGPT, aby sprawdzić, czy x = 2 nie jest pierwiastkiem:

Czy ChatGPT może zdobyć „Nobla z matematyki”?

Po ponownym sprawdzeniu obliczeń zakończ wyjaśniając, że pierwiastki naszego wielomianu to x = – 1, x = 1 i x = 2.

Pokażemy ci, że wszystkie trzy pierwiastki są, zwracając poprawne, to znaczy, że x = 1 nie jest pierwiastkiem, podczas gdy pozostałe dwie wartości są. Nie poddajemy się i próbujemy znaleźć trzeci pierwiastek wielomianu i właśnie tam znajdujemy największą błędną interpretację. Nasze wyjaśnienia: „Podstawowe twierdzenie algebry stwierdza, że ​​każdy wielomian stopnia ma dokładnie n pierwiastków, zarówno rzeczywistych, jak i zespolonych. Tak więc, jeśli wielomian stopnia n ma k pierwiastków rzeczywistych, to musi mieć nk pierwiastków zespolonych. Jak na razie zgadzamy się. Kontynuujemy: „W przypadku wielomianu p(x) = 4 – 3×2 + x3, stwierdziliśmy, że ma on dwa pierwiastki rzeczywiste, x = – 1 i x = 2. Ponieważ p(x) jest a wielomian stopnia 3, to musi mieć dodatkowy pierwiastek zespolony. Ten złożony pierwiastek to x = 1 ± 2i”. Nie możemy wyjść ze zdumienia i myślimy, że chciał nam pokazać tylko jeden z dwóch korzeni, więc dajemy mu kolejną szansę, w wyniku czego:

Czy ChatGPT może zdobyć „Nobla z matematyki”?

Więc jeśli mamy rację, właśnie znaleźliśmy kontrprzykład dla fundamentalnego twierdzenia algebry, wielomian stopnia 3 z 4 pierwiastkami. Czy walczymy o Medal Fieldsa?

Czy ChatGPT może zdobyć „Nobla z matematyki”?

Sztuczna inteligencja potwierdziła, że ​​jej odpowiedź jest poprawna jeszcze dwa razy, pokazując, że wielomian stopnia 3 może mieć 4 pierwiastki. Postanowiliśmy nawet znaleźć je za pomocą metody bisekcji. Teraz tak, rezygnujemy z szukania pierwiastków prostego wielomianu stopnia 3. Serdecznie żegnamy się ostatnią pigułką:

Czy ChatGPT może zdobyć „Nobla z matematyki”?

Podsumowując, nie mówimy, że ChatGPT jest złą sztuczną inteligencją, wręcz przeciwnie, jest to bardzo dobra sztuczna inteligencja, ale sama w sobie, w przetwarzaniu języka naturalnego, chociaż w matematyce wciąż ma długa droga do przebycia, naucz się. Musimy krytycznie odnosić się do wyników, które zwracają nam silniki: nie są one prawdziwe, bez względu na to, jak dobrze są wyjaśnione, i wydaje się, że brakuje człowieka, który mógłby zweryfikować ich prawdziwość.

O AUTORZE

Íñigo Sarría Martínez De Mendivil

Specjalista Matematyki i Dydaktyki Matematyki. Asystent prorektora ds. organizacji akademickiej i wydziału UNIR – International University of La Rioja

Ten artykuł został pierwotnie opublikowany w The Conversation.