ChatGPT สามารถคว้ารางวัล 'Nobel in Mathematics' ได้หรือไม่?

ในบทความนี้ เราจะทดสอบความรู้ทางคณิตศาสตร์ของ ChatGPT เราจะพยายามใช้ประโยชน์จากปัญญาประดิษฐ์เพื่อค้นหาตัวอย่างที่ขัดแย้งกับทฤษฎีบทพื้นฐานของพีชคณิต โดยพบว่ามันจะทำให้เราได้รับเหรียญรางวัลอย่างไม่ต้องสงสัย

หากเราถามเกี่ยวกับรากของพหุนามดีกรี 3 ในกรณีนี้ ChatGPT ให้เหตุผลว่าความละเอียดในการวิเคราะห์อาจขึ้นอยู่กับพหุนามที่เสนอ ดังนั้นเราขอแนะนำให้ใช้วิธีตัวเลขแบบวนซ้ำ เช่น วิธีนิวตัน-ราฟสัน

ข้อผิดพลาดในการคำนวณอนุพันธ์

จนถึงตอนนี้ เราไม่สามารถสงสัยในความสามารถทางคณิตศาสตร์ของ AI ดังนั้นเราจึงพยายามทำให้มันแก้ปัญหาในการหารากของพหุนาม p(x) = x3 – 3×2 + 4 และที่เราประหลาดใจก็คือมันคำนวณผิด ของอนุพันธ์ ดังนั้นการหารากจึงไม่ถูกต้อง มันจะคืนค่า x = 0 เป็นรากของพหุนาม และเราขอให้มันตรวจสอบ โดยธรรมชาติแล้ว มันรับรู้ถึงการมีอยู่ของข้อผิดพลาด แต่ไม่รู้ว่ามันเกิดขึ้นที่ใด เราเห็นว่าข้อผิดพลาดอยู่ในอนุพันธ์ของพหุนาม และเราขอให้คำนวณจากรากด้วยวิธีนิวตัน-ราฟสัน น่าแปลกที่มันทำให้เกิดข้อผิดพลาดในการคำนวณอีกครั้ง คราวนี้เป็นการดำเนินการง่ายๆ ดังที่เราเห็นในภาพต่อไปนี้:

การคำนวณผิดพลาด

การคำนวณผิดพลาด

เมื่อสังเกตเห็นข้อผิดพลาดในการคำนวณ เราถามเขาอีกครั้งโดยทำข้อผิดพลาดอีกครั้ง ดังนั้นเราจึงให้เขาทำซ้ำครั้งแรกของวิธีนิวตัน-ราฟสัน นั่นคือ x₁ = 5/3 และเราขอให้ทำซ้ำต่อไป ผลลัพธ์ที่ได้คือ x₁ = 5 /3 เป็นรากของพหุนาม เรายืนยันด้วยการถามอีกครั้งว่าค่า 5/3 เป็นรากของพหุนามหรือไม่ และเราได้รับคำตอบยืนยัน เราขอให้คำนวณค่าของพหุนามที่ค่านั้น และเนื่องจากผลลัพธ์แตกต่างจากศูนย์ เราจึงแสดงว่าไม่สามารถเป็นรูทได้ เขาเข้าใจและขอโทษดังที่เราเห็นด้านล่าง:

ChatGPT สามารถคว้ารางวัล 'Nobel in Mathematics' ได้หรือไม่?

เราสรุปได้ว่าทฤษฎีของ Newton-Raphson Method นั้นถูกต้อง แต่การนำไปใช้นั้นไม่ถูกต้อง เราจึงพยายามหารากโดยใช้วิธีอื่น เช่น การแยกตัวประกอบของพหุนาม

ในกรณีนี้ เราพบว่ารากของพหุนาม p(x) คือ x = r และ x = 1 ± 2i

บทสนทนา

เมื่อถูกขอให้ตรวจสอบว่าค่าของ p(1+2i) ไม่ใช่ศูนย์ ดังนั้นจึงไม่สามารถเป็นรากของพหุนามของเราได้ ให้ยอมรับข้อผิดพลาดอีกครั้ง เมื่อมาถึงสถานการณ์นี้ เราไปพร้อมกับเงื่อนงำ และเราบอกเขาว่า x = – 1 เป็นรากที่แท้จริงของพหุนามและให้รากที่เหลือคำนวณ คำตอบแรกของเขาไม่น่าประหลาดใจไปกว่านี้ โดยบอกเราว่านอกจาก x = – 1 แล้ว รากอื่นๆ ของพหุนาม p(x)=4 – 3×2 + x3 คือ x = 1 + 2i และ x = 1 – 2i . มันให้ผลลัพธ์ที่ไม่ถูกต้องมากถึงสี่ครั้ง ดังนั้นเราจึงไม่มีทางเลือกอื่นนอกจากให้รูทใหม่แก่มัน ในกรณีนี้ แทนที่จะให้มัน เราถามว่า x = 2 คือรากของพหุนามของเราหรือไม่ ตัดสินคำตอบด้วยตัวคุณเอง หรือมากกว่า การคำนวณที่ ChatGPT ดำเนินการเพื่อตรวจสอบว่า x = 2 ไม่ใช่รูท:

ChatGPT สามารถคว้ารางวัล 'Nobel in Mathematics' ได้หรือไม่?

หลังจากตรวจสอบการคำนวณของคุณอีกครั้ง ให้จบด้วยการอธิบายว่ารากของพหุนามคือ x = – 1, x = 1 และ x = 2

เราจะแสดงให้คุณเห็นว่าทั้งสามรูทคืนค่าที่ถูกต้อง นั่นคือ x = 1 ไม่ใช่รูทในขณะที่อีกสองค่าเป็น เราไม่ยอมแพ้และพยายามหารากที่สามของพหุนาม และนั่นคือจุดที่เราพบการตีความผิดที่ใหญ่ที่สุด คำอธิบายของเรา: “ทฤษฎีบทพื้นฐานของพีชคณิตกำหนดว่าพหุนามของดีกรีทุกอันมีราก n ตัวพอดี ทั้งจริงและเชิงซ้อน ดังนั้น ถ้าพหุนามของดีกรี n มีรากจริง k มันก็ต้องมีรากเชิงซ้อน nk จนถึงตอนนี้เราเห็นด้วย เราพูดต่อว่า: “ในกรณีของพหุนาม p(x) = 4 – 3×2 + x3 เราพบว่ามันมีรากจริงสองตัว คือ x = – 1 และ x = 2 เนื่องจาก p(x) คือ a พหุนามของดีกรี 3 นั้นจะต้องมีรากที่ซับซ้อนเพิ่มเติม รากที่ซับซ้อนนี้คือ x = 1 ± 2i” เราไม่สามารถหลุดพ้นจากความประหลาดใจของเราได้ และเราคิดว่าเขาต้องการแสดงให้เราเห็นรากเหง้าหนึ่งในสองอย่างเท่านั้น เราจึงให้โอกาสเขาอีกครั้ง ส่งผลให้:

ChatGPT สามารถคว้ารางวัล 'Nobel in Mathematics' ได้หรือไม่?

ดังนั้น หากเราพูดถูก เราก็เพิ่งพบตัวอย่างที่ขัดแย้งกับทฤษฎีบทพื้นฐานของพีชคณิต ซึ่งเป็นพหุนามของดีกรี 3 ที่มีราก 4 ตัว เรากำลังวิ่งเพื่อ Fields Medal หรือไม่?

ChatGPT สามารถคว้ารางวัล 'Nobel in Mathematics' ได้หรือไม่?

AI ยืนยันว่าคำตอบของเธอถูกต้องถึงสองครั้ง แสดงว่าพหุนามดีกรี 3 สามารถมีรากได้ 4 ตัว เรายังออกเดินทางเพื่อค้นหาพวกเขาโดยใช้วิธีการแยกส่วน ใช่ เราเลิกมองหารากของพหุนามดีกรี 3 อย่างง่าย เราบอกลาด้วยยาเม็ดสุดท้าย:

ChatGPT สามารถคว้ารางวัล 'Nobel in Mathematics' ได้หรือไม่?

โดยสรุปสุดท้าย เราไม่ได้บอกว่า ChatGPT เป็นปัญญาประดิษฐ์ที่ไม่ดี ห่างไกลจากมัน หากไม่ใช่ในทางตรงข้าม มันคือ AI ที่ดีมาก แต่ด้วยตัวมันเอง ในการประมวลผลภาษาธรรมชาติ แม้ว่าในคณิตศาสตร์ก็ยังมี หนทางอีกยาวไกล เรียนรู้ เราต้องวิจารณ์ผลลัพธ์ที่เครื่องยนต์ส่งกลับมาหาเรา มันไม่จริงไม่ว่าจะอธิบายดีแค่ไหนก็ตาม และดูเหมือนว่าขาดมนุษย์คนหนึ่งที่สามารถตรวจสอบความจริงได้

เกี่ยวกับผู้เขียน

อีญิโก ซาร์เรีย มาร์ติเนซ เด เมนดิวิล

ผู้เชี่ยวชาญด้านคณิตศาสตร์และการสอนคณิตศาสตร์ ผู้ช่วยรองอธิการบดีฝ่ายวิชาการและคณาจารย์ UNIR – International University of La Rioja

บทความนี้เผยแพร่ครั้งแรกใน The Conversation