當(dāng)前最新：ChatGPT的智能還不如貓狗？

時間：2023-02-15 11:08:34

對話式人工智能（AI）正受到廣泛關(guān)注。在網(wǎng)站上向AI提問時，它會像真人寫的一樣用自然的語句做出回答。由于美國谷歌和微軟等大型科技企業(yè)參與相關(guān)競爭，這更吸引著全球熱切的目光。

但是，直至目前公開的對話AI仍存在嚴(yán)重缺陷。雖然是由AI讀取大量數(shù)據(jù)，可以給出像模像樣的答案，但也存在很多致命性錯誤。很難說AI真正理解了問題和自己用于作答的詞匯的“含義”。

通過梳理“ChatGPT”等對話AI出現(xiàn)的諸多錯誤，就可以發(fā)現(xiàn)機(jī)器要達(dá)到真正的智能所面臨的核心技術(shù)課題。

(資料圖)

“老師”和“親媽”將展開競爭

由于2022年秋季美國初創(chuàng)企業(yè)OpenAI免費(fèi)公開的ChatGPT在全世界引發(fā)熱議，此前一直不打算向公眾公開對話AI的谷歌改變了方針。

2月6日，谷歌首席執(zhí)行官（CEO）桑德爾·皮查伊親自在官方博客上宣布，未來幾周內(nèi)將在搜索服務(wù)中嵌入名為“Bard”的對話AI并投入使用。

谷歌CEO桑德爾·皮查伊宣稱AI是谷歌最重要的技術(shù)領(lǐng)域（2022年10月，東京都澀谷區(qū)）

據(jù)稱，在搜索欄中輸入提問內(nèi)容后，會顯示用自然流暢的語句給出的答案，以及回答問題時作為依據(jù)所參考的網(wǎng)頁鏈接。

事實(shí)上，領(lǐng)先一步的ChatGPT的基礎(chǔ)是基于AI的大型語言模型，該模型建立在谷歌開發(fā)的被稱為“Transformer”的技術(shù)之上。不僅如此，谷歌還擁有數(shù)據(jù)量和能夠生成的句子類型數(shù)量遠(yuǎn)多于OpenAI的模型。對于OpenAI來說，谷歌公開對話AI，就好比“老師”突然變成了競爭對手。

在“老師”發(fā)布消息之后，“親媽”也跟著行動起來。在谷歌宣布公開對話AI的第二天（2月7日），OpenAI的大股東微軟也發(fā)布消息稱，在搜索服務(wù)必應(yīng)（Bing）中嵌入了基于OpenAI技術(shù)的對話功能。據(jù)稱，通過與搜索功能同時使用，可以根據(jù)最新信息以自然流暢的語句做出回答，還能夠?qū)﹂L達(dá)好幾頁的文檔進(jìn)行概括提煉。

不善于追逐最新信息

谷歌和微軟都強(qiáng)調(diào)，通過同時使用搜索和生成自然語言的功能，可以根據(jù)網(wǎng)上的最新信息生成語句。反過來說，對話AI此前一直不擅長追逐最新信息。

ChatGPT等的大型語言模型，每次更新信息內(nèi)容時，都需要重新讀取數(shù)量龐大的文獻(xiàn)數(shù)據(jù)。因?yàn)楹茈y頻繁更新，所以模型內(nèi)保存的信息大多比較舊。

比如，當(dāng)詢問ChatGPT“洛杉磯湖人隊（Los Angeles Lakers）最近一場比賽的上場陣容”時，得到的回答是“我只具備2021年之前的知識，無法回答您的問題”。

谷歌和微軟的對話AI同時使用網(wǎng)絡(luò)搜索，因此會在信息的同步性和準(zhǔn)確性方面取得巨大進(jìn)步。盡管如此，谷歌在2月8日進(jìn)行Bard的演示時，仍顯示出了錯誤信息，說是美國航空航天局（NASA）的詹姆斯韋伯太空望遠(yuǎn)鏡成功拍攝到了史上第一張?zhí)栂低庑行堑恼掌?。這一錯誤信息隨后引發(fā)爭議。可見，信息的準(zhǔn)確性仍有不少課題需要解決。

缺乏常識和邏輯

除了上述的問題外，對話AI還存在根本性的課題。目前推出的對話AI基本上都很難說已經(jīng)可以理解自己所使用的詞匯的概念、含義、事物或現(xiàn)象的因果關(guān)系等“邏輯”。正因?yàn)槿绱?，才會反?fù)出現(xiàn)簡單的事實(shí)誤認(rèn)。

例如，向ChatGPT詢問“哥哥和姐姐有什么不同”時，得到的回答是“雖然兄弟姐妹關(guān)系因家庭結(jié)構(gòu)和出生順序不同而存在差異，但哥哥通常比姐姐年齡大”。之所以給出這樣不知所以然的答案，是因?yàn)闆]有“理解”哥哥、姐姐等詞語的概念、相互之間的關(guān)系、家庭構(gòu)成等全局情況。

向ChatGPT詢問“哥哥”和“姐姐”的區(qū)別時，得到的回答含有錯誤內(nèi)容

之所以會出現(xiàn)這樣的錯誤，是因?yàn)楝F(xiàn)在使用的絕大部分語言模型是機(jī)器學(xué)習(xí)型AI。因此，使用的語言基本上是單詞和短語的“排列”，機(jī)器通過讀入數(shù)量龐大的過去的文獻(xiàn)來識別排列類型。然后再計算出各類型出現(xiàn)的概率，尋找出接在問題之后的概率較高的字符串并加以顯示。

例如，在日語語言模型中輸入“我が輩（中文譯：我）”，使其生成后續(xù)的語句時，答案就會顯示在書籍、新聞報道、網(wǎng)站留言中出現(xiàn)概率最高的排列組合類型，即“は貓である（中文譯：是貓）”（見下圖）。ChatGPT還可以直接生成與“夏目漱石風(fēng)格”的小說相類似的句子。

（編者注：《我が輩は貓である》是日本作家夏目漱石的長篇代表作，中文譯名為《我是貓》）

語言模型是“學(xué)習(xí)”在基本單詞之后銜接什么單詞的概率，并生成句子。（資料由NTT數(shù)據(jù)尖端技術(shù)提供）

簡單計算也會出錯

也就是說，聊天AI不過是根據(jù)讀取數(shù)據(jù)找出概率高的詞序，并不是理解單詞、語句的“含義”以及家庭成員之間的關(guān)系等“常識”。因此，它不擅長回答那些不理解意義和常識就難以回答的問題。

由于不擅長邏輯，因此Chat GPT也不擅長簡單的計算。讓它做任意4位數(shù)之間的乘法，大都會算錯，并且反復(fù)輸入相同算式時，總是給出錯誤的答案。

讓ChatGPT計算4567×5678的乘法，會給出錯誤的答案。大規(guī)模語言模型不擅長世上文獻(xiàn)很少的小學(xué)生水平的數(shù)學(xué)。

也就是說，現(xiàn)有的聊天AI不適合用于調(diào)查事實(shí)。而應(yīng)該僅限于在不管內(nèi)容的真實(shí)性和準(zhǔn)確性，只需要自動生成自然語句和軟件程序等文字列的目的時使用。

機(jī)器學(xué)習(xí)的極限和下一個AI

那么，擁有與人類相當(dāng)?shù)摹爸悄堋钡腁I的開發(fā)到底有沒有取得進(jìn)展呢？熟悉日本國內(nèi)外動向的日本科學(xué)技術(shù)振興機(jī)構(gòu)研究開發(fā)戰(zhàn)略中心的研究員福島俊一表示：“具有邏輯思考、常識和認(rèn)知的新一代AI的研究從幾年前就在推進(jìn)”。

AI掀起過3次新技術(shù)浪潮。分別是1960年代、1980年代及從2010年代持續(xù)至今的第三次。其中，1960年代和1980年代是計算機(jī)根據(jù)人類預(yù)先編制好的邏輯，分析數(shù)據(jù)得出結(jié)論。由此也發(fā)現(xiàn)編制支持現(xiàn)實(shí)的無數(shù)邏輯不太可能，于是上一波浪潮在1990年代開始走向衰退。

2010年代開始、持續(xù)到現(xiàn)在的AI浪潮并不是人類思考邏輯，而是由讓計算機(jī)自己歸納出數(shù)據(jù)的各種類型的機(jī)器學(xué)習(xí)來引領(lǐng)。隨著相當(dāng)于計算機(jī)大腦的半導(dǎo)體性能越來越高以及互聯(lián)網(wǎng)普及，可以收集全世界的數(shù)據(jù)，被稱為“深層學(xué)習(xí)”的可以識別復(fù)雜類型的軟件技術(shù)問世等要素全部得以實(shí)現(xiàn)。

如果將機(jī)器學(xué)習(xí)型AI和“大數(shù)據(jù)”結(jié)合起來，限定于特定用途，就可以完成人類不可能完成的工作。比如，通過讀取大量的面部照片，提高圖形識別能力，從而實(shí)現(xiàn)智能手機(jī)開機(jī)時的面容解鎖。

Digital Garage董事伊藤穰一指出了依賴機(jī)器學(xué)習(xí)的AI的“極限”

不過，要實(shí)現(xiàn)自動駕駛及自律型多功能機(jī)器人，相當(dāng)于頭腦的AI要具有識別眼前物體和周圍情況的能力，其中包括過去沒經(jīng)歷過的情況。

這需要基于邏輯和常識的推論能力，僅靠依賴“過去”事例的機(jī)器學(xué)習(xí)型模型并不能順利實(shí)現(xiàn)。熟悉尖端技術(shù)動向的Digital Garage公司董事伊藤穰一指出：“谷歌、特斯拉及蘋果仍很難將自動駕駛汽車推向?qū)嵱谜f明依靠機(jī)器學(xué)習(xí)的AI存在極限”。

“別說人類，就連貓狗的智能都遠(yuǎn)未達(dá)到”

對話型AI缺乏“常識”和“道理”也源于根據(jù)數(shù)據(jù)以歸納法方式探索相關(guān)類型的機(jī)器學(xué)習(xí)型AI的弱點(diǎn)。

兼具常識和邏輯思考的新一代AI如何才能實(shí)現(xiàn)？參考人類兒童自然掌握語言、空間認(rèn)識及社會關(guān)系等的過程，讓計算機(jī)學(xué)習(xí)邏輯和常識的研究正以腦科學(xué)家和認(rèn)知科學(xué)家也參與的跨學(xué)科途徑推進(jìn)。另外，也有將在第2次AI浪潮下失敗的人類輸入邏輯和常識與尖端的深層學(xué)習(xí)相融合的嘗試。

關(guān)于通過機(jī)器實(shí)現(xiàn)與人類接近的智能這一長期目標(biāo)與現(xiàn)有AI技術(shù)的差距，開拓深層學(xué)習(xí)基本技術(shù)的美國Meta首席AI科學(xué)家、紐約大學(xué)教授Yann Lucan形容道：“目前先別說人類，就連貓狗的智能都遠(yuǎn)未達(dá)到”。

我們不能因?yàn)榭吹綄υ扐I的流暢文章就誤以為AI智能已經(jīng)接近超越人類的“特異功能”（Singularity）。人類的科學(xué)技術(shù)在達(dá)到這一水平之前還需要實(shí)現(xiàn)眾多突破。

本文作者為日本經(jīng)濟(jì)新聞編輯委員小柳建彥

關(guān)鍵詞： chatgpt

延伸閱讀:

版權(quán)聲明：
凡注明來網(wǎng)絡(luò)消費(fèi)網(wǎng)的作品，版權(quán)均屬網(wǎng)絡(luò)消費(fèi)網(wǎng)所有，未經(jīng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的，應(yīng)在授權(quán)范圍內(nèi)使用，并注明"來源：網(wǎng)絡(luò)消費(fèi)網(wǎng)"。違反上述聲明者，本網(wǎng)將追究其相關(guān)法律責(zé)任。
除來源署名為網(wǎng)絡(luò)消費(fèi)網(wǎng)稿件外，其他所轉(zhuǎn)載內(nèi)容之原創(chuàng)性、真實(shí)性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考并自行核實(shí)。

熱文