ChatGPT、Gemini等生成式AI可以快速解答各種問題,還能將龐雜的文字有條理的提供給用戶,但簡單到不行的小學數學題目,比較數字大小卻難倒各AI,有網友發現詢問ChatGPT「9.11和9.9兩個數字誰比較大?」AI竟回答「9.11」錯得離譜的答案,嚇出了73萬次瀏覽,有人直接開酸「數學奇蹟」。當中也釣出內行的工程師解答AI出錯原因。
有網友在Threads 發文表示「ChatGPT自爆了」,文字貼出一則簡單的小學數學題目,請ChatGPT解答帶有小數點的數字大小,「9.11和9.9兩個數字誰比較大?」,詢問小學生大多可以立即辨識出「9.9大」,但ChatGPT卻斬釘截鐵回答「9.11比較大」,讓用戶看了答案後當場傻眼,但只要再詢問「確定嗎?」或是再問一次,就會給出正確答案。
記者也實際用相同的題目測試ChatGPT、Gemini、perplexity和Grok,第一次只有ChatGPT o3模型和Grok回答出正確答案,Gemini、perplexity都認為「9.11大過於9.9」。同樣的只要稍有質疑,AI大多都會給出正確答案。
在留言裡也有不少內行人出面解釋,大型語言模型本質是「字串預測」,「9.11」在AI大腦裡顯示的為「9」「.」「11」,但沒有真正把小數轉成 9 + 0.11 的數字,所以就會變成9.11比較大,另外,也有人提到,9.11會被視為日期或版本,而不是一個小數點,才會給出錯誤答案。
我是廣告 請繼續往下閱讀
記者也實際用相同的題目測試ChatGPT、Gemini、perplexity和Grok,第一次只有ChatGPT o3模型和Grok回答出正確答案,Gemini、perplexity都認為「9.11大過於9.9」。同樣的只要稍有質疑,AI大多都會給出正確答案。
在留言裡也有不少內行人出面解釋,大型語言模型本質是「字串預測」,「9.11」在AI大腦裡顯示的為「9」「.」「11」,但沒有真正把小數轉成 9 + 0.11 的數字,所以就會變成9.11比較大,另外,也有人提到,9.11會被視為日期或版本,而不是一個小數點,才會給出錯誤答案。