ChatGPT能否獲得“數學界的諾貝爾獎”?

在本文中,我們將測試 ChatGPT 的數學知識。 我們將嘗試利用人工智能來找到代數基本定理的反例,發現它無疑會讓我們走向菲爾茲獎。

如果我們詢問 3 次多項式的根,在這種情況下都是實數,ChatGPT 認為解析分辨率可能取決於所提出的多項式,因此我們建議使用迭代數值方法,例如 Newton-Raphson 方法。

導數計算錯誤

到目前為止,我們不能懷疑人工智能的數學能力,所以我們試圖讓它解決多項式 p(x) = x3 – 3×2 + 4 的求根問題,但令我們驚訝的是它計算錯誤的導數,所以求根是不正確的。 它返回 x = 0 作為多項式的根,我們要求它檢查它。 自然地,它知道錯誤的存在,但不知道它發生在哪裡。 我們已經看到誤差在多項式的導數中,我們要求它是通過 Newton-Raphson 方法從根計算的。 令人驚訝的是,它再次出現計算錯誤,這次是在一個簡單的操作中,如下圖所示:

失算

失算

注意到計算錯誤,我們又問他,又犯了一個錯誤,所以我們給他牛頓-拉夫森法的第一次迭代,即 x₁ = 5/3 我們要求繼續迭代,結果 x₁ = 5 /3 是多項式的根。 我們通過再次詢問值 5/3 是否是多項式的根來證實,我們得到了肯定的答案。 我們要求計算該值處的多項式值,並且由於結果不為零,我們證明它不可能是根。 他理解並道歉,如下所示:

ChatGPT能否獲得“數學界的諾貝爾獎”?

我們得出結論,牛頓-拉夫遜法的理論是正確的,但它的應用是不正確的,因此我們嘗試使用其他方法求根,例如多項式的因式分解。

在這種情況下,我們發現多項式 p(x) 的根是 x = r 和 x = 1 ± 2i。

談話

當要求驗證 p(1+2i) 的值不為零且因此不能成為多項式的根時,再次確認錯誤。 到達這種情況,我們帶著線索,告訴他 x = – 1 是多項式的實根,其餘的根計算。 他的第一個答案非常令人驚訝,告訴我們除了 x = – 1 之外,多項式 p(x)=4 – 3×2 + x3 的其他根是 x = 1 + 2i 和 x = 1 – 2i . 最多四次它再次給出錯誤的結果,所以我們別無選擇,只能為它提供一個新的根。 在這種情況下,我們不給出它,而是詢問 x = 2 是否是多項式的根。 自己判斷答案,或者更確切地說,ChatGPT 為檢查 x = 2 不是根而執行的計算:

ChatGPT能否獲得“數學界的諾貝爾獎”?

再次檢查你的計算後,最後解釋一下我們多項式的根是 x = – 1、x = 1 和 x = 2。

我們將向您展示所有三個根都是,返回正確的,即 x = 1 不是根而其他兩個值是。 我們不放棄並試圖找到多項式的三次方根,而這恰恰是我們發現最大誤解的地方。 我們的解釋:“代數基本定理確立了每個度數多項式恰好有 n 個根,既有實根也有復根。 因此,如果 n 次多項式有 k 個實根,則它必須有 nk 個複根。 到目前為止我們都同意。 我們繼續:“在多項式 p(x) = 4 – 3×2 + x3 的情況下,我們發現它有兩個實根,x = – 1 和 x = 2。因為 p(x) 是一個3 次多項式,則它必須有一個附加的複根。 這個複根是 x = 1 ± 2i。” 我們無法擺脫我們的驚訝,我們認為他只是想向我們展示兩個根中的一個,所以我們再給他一次機會,結果是:

ChatGPT能否獲得“數學界的諾貝爾獎”?

所以如果我們是對的,我們剛剛找到了代數基本定理的反例,一個 3 次有 4 個根的多項式。 我們在競選菲爾茲獎嗎?

ChatGPT能否獲得“數學界的諾貝爾獎”?

AI 再次確認她的答案是正確的最多兩次,表明 3 次多項式可以有 4 個根。 我們甚至開始使用二分法找到它們。 現在是的,我們放棄尋找簡單的 3 次多項式的根。 我們誠摯地與最後一顆藥丸說再見:

ChatGPT能否獲得“數學界的諾貝爾獎”?

作為最後的總結,我們並不是說 ChatGPT 是一個糟糕的人工智能,遠非如此,即使不是恰恰相反,它也是非常好的人工智能,但就其本身而言,在自然語言處理方面,儘管在數學方面它仍然有一個任重而道遠。學習。 我們必須對引擎返回給我們的結果持批評態度:無論解釋得多麼好,它們都不是真的,而且似乎缺少一個可以驗證其真實性的人。

關於作者

伊尼戈·薩里亞·馬丁內斯·德·門迪維爾

數學和數學教學專家。 拉里奧哈國際大學 UNIR 學術組織和教師副校長助理

這篇文章最初發表在 The Conversation 上。