對話式人工智能(AI)正受到廣泛關(guān)注。在網(wǎng)站上向AI提問時,它會像真人寫的一樣用自然的語句做出回答。由于美國谷歌和微軟等大型科技企業(yè)參與相關(guān)競爭,這更吸引著全球熱切的目光。
但是,直至目前公開的對話AI仍存在嚴(yán)重缺陷。雖然是由AI讀取大量數(shù)據(jù),可以給出像模像樣的答案,但也存在很多致命性錯誤。很難說AI真正理解了問題和自己用于作答的詞匯的“含義”。
通過梳理“ChatGPT”等對話AI出現(xiàn)的諸多錯誤,就可以發(fā)現(xiàn)機器要達(dá)到真正的智能所面臨的核心技術(shù)課題。
(資料圖)
“老師”和“親媽”將展開競爭
由于2022年秋季美國初創(chuàng)企業(yè)OpenAI免費公開的ChatGPT在全世界引發(fā)熱議,此前一直不打算向公眾公開對話AI的谷歌改變了方針。
2月6日,谷歌首席執(zhí)行官(CEO)桑德爾·皮查伊親自在官方博客上宣布,未來幾周內(nèi)將在搜索服務(wù)中嵌入名為“Bard”的對話AI并投入使用。
谷歌CEO桑德爾·皮查伊宣稱AI是谷歌最重要的技術(shù)領(lǐng)域(2022年10月,東京都澀谷區(qū))
據(jù)稱,在搜索欄中輸入提問內(nèi)容后,會顯示用自然流暢的語句給出的答案,以及回答問題時作為依據(jù)所參考的網(wǎng)頁鏈接。
事實上,領(lǐng)先一步的ChatGPT的基礎(chǔ)是基于AI的大型語言模型,該模型建立在谷歌開發(fā)的被稱為“Transformer”的技術(shù)之上。不僅如此,谷歌還擁有數(shù)據(jù)量和能夠生成的句子類型數(shù)量遠(yuǎn)多于OpenAI的模型。對于OpenAI來說,谷歌公開對話AI,就好比“老師”突然變成了競爭對手。
在“老師”發(fā)布消息之后,“親媽”也跟著行動起來。在谷歌宣布公開對話AI的第二天(2月7日),OpenAI的大股東微軟也發(fā)布消息稱,在搜索服務(wù)必應(yīng)(Bing)中嵌入了基于OpenAI技術(shù)的對話功能。據(jù)稱,通過與搜索功能同時使用,可以根據(jù)最新信息以自然流暢的語句做出回答,還能夠?qū)﹂L達(dá)好幾頁的文檔進行概括提煉。
不善于追逐最新信息
谷歌和微軟都強調(diào),通過同時使用搜索和生成自然語言的功能,可以根據(jù)網(wǎng)上的最新信息生成語句。反過來說,對話AI此前一直不擅長追逐最新信息。
ChatGPT等的大型語言模型,每次更新信息內(nèi)容時,都需要重新讀取數(shù)量龐大的文獻數(shù)據(jù)。因為很難頻繁更新,所以模型內(nèi)保存的信息大多比較舊。
比如,當(dāng)詢問ChatGPT“洛杉磯湖人隊(Los Angeles Lakers)最近一場比賽的上場陣容”時,得到的回答是“我只具備2021年之前的知識,無法回答您的問題”。
谷歌和微軟的對話AI同時使用網(wǎng)絡(luò)搜索,因此會在信息的同步性和準(zhǔn)確性方面取得巨大進步。盡管如此,谷歌在2月8日進行Bard的演示時,仍顯示出了錯誤信息,說是美國航空航天局(NASA)的詹姆斯韋伯太空望遠(yuǎn)鏡成功拍攝到了史上第一張?zhí)栂低庑行堑恼掌?。這一錯誤信息隨后引發(fā)爭議??梢姡畔⒌臏?zhǔn)確性仍有不少課題需要解決。
缺乏常識和邏輯
除了上述的問題外,對話AI還存在根本性的課題。目前推出的對話AI基本上都很難說已經(jīng)可以理解自己所使用的詞匯的概念、含義、事物或現(xiàn)象的因果關(guān)系等“邏輯”。正因為如此,才會反復(fù)出現(xiàn)簡單的事實誤認(rèn)。
例如,向ChatGPT詢問“哥哥和姐姐有什么不同”時,得到的回答是“雖然兄弟姐妹關(guān)系因家庭結(jié)構(gòu)和出生順序不同而存在差異,但哥哥通常比姐姐年齡大”。之所以給出這樣不知所以然的答案,是因為沒有“理解”哥哥、姐姐等詞語的概念、相互之間的關(guān)系、家庭構(gòu)成等全局情況。
向ChatGPT詢問“哥哥”和“姐姐”的區(qū)別時,得到的回答含有錯誤內(nèi)容
之所以會出現(xiàn)這樣的錯誤,是因為現(xiàn)在使用的絕大部分語言模型是機器學(xué)習(xí)型AI。因此,使用的語言基本上是單詞和短語的“排列”,機器通過讀入數(shù)量龐大的過去的文獻來識別排列類型。然后再計算出各類型出現(xiàn)的概率,尋找出接在問題之后的概率較高的字符串并加以顯示。
例如,在日語語言模型中輸入“我が輩(中文譯:我)”,使其生成后續(xù)的語句時,答案就會顯示在書籍、新聞報道、網(wǎng)站留言中出現(xiàn)概率最高的排列組合類型,即“は貓である(中文譯:是貓)”(見下圖)。ChatGPT還可以直接生成與“夏目漱石風(fēng)格”的小說相類似的句子。
(編者注:《我が輩は貓である》是日本作家夏目漱石的長篇代表作,中文譯名為《我是貓》)
語言模型是“學(xué)習(xí)”在基本單詞之后銜接什么單詞的概率,并生成句子。(資料由NTT數(shù)據(jù)尖端技術(shù)提供)
簡單計算也會出錯
也就是說,聊天AI不過是根據(jù)讀取數(shù)據(jù)找出概率高的詞序,并不是理解單詞、語句的“含義”以及家庭成員之間的關(guān)系等“常識”。因此,它不擅長回答那些不理解意義和常識就難以回答的問題。
由于不擅長邏輯,因此Chat GPT也不擅長簡單的計算。讓它做任意4位數(shù)之間的乘法,大都會算錯,并且反復(fù)輸入相同算式時,總是給出錯誤的答案。
讓ChatGPT計算4567×5678的乘法,會給出錯誤的答案。大規(guī)模語言模型不擅長世上文獻很少的小學(xué)生水平的數(shù)學(xué)。
也就是說,現(xiàn)有的聊天AI不適合用于調(diào)查事實。而應(yīng)該僅限于在不管內(nèi)容的真實性和準(zhǔn)確性,只需要自動生成自然語句和軟件程序等文字列的目的時使用。
機器學(xué)習(xí)的極限和下一個AI
那么,擁有與人類相當(dāng)?shù)摹爸悄堋钡腁I的開發(fā)到底有沒有取得進展呢?熟悉日本國內(nèi)外動向的日本科學(xué)技術(shù)振興機構(gòu)研究開發(fā)戰(zhàn)略中心的研究員福島俊一表示:“具有邏輯思考、常識和認(rèn)知的新一代AI的研究從幾年前就在推進”。
AI掀起過3次新技術(shù)浪潮。分別是1960年代、1980年代及從2010年代持續(xù)至今的第三次。其中,1960年代和1980年代是計算機根據(jù)人類預(yù)先編制好的邏輯,分析數(shù)據(jù)得出結(jié)論。由此也發(fā)現(xiàn)編制支持現(xiàn)實的無數(shù)邏輯不太可能,于是上一波浪潮在1990年代開始走向衰退。
2010年代開始、持續(xù)到現(xiàn)在的AI浪潮并不是人類思考邏輯,而是由讓計算機自己歸納出數(shù)據(jù)的各種類型的機器學(xué)習(xí)來引領(lǐng)。隨著相當(dāng)于計算機大腦的半導(dǎo)體性能越來越高以及互聯(lián)網(wǎng)普及,可以收集全世界的數(shù)據(jù),被稱為“深層學(xué)習(xí)”的可以識別復(fù)雜類型的軟件技術(shù)問世等要素全部得以實現(xiàn)。
如果將機器學(xué)習(xí)型AI和“大數(shù)據(jù)”結(jié)合起來,限定于特定用途,就可以完成人類不可能完成的工作。比如,通過讀取大量的面部照片,提高圖形識別能力,從而實現(xiàn)智能手機開機時的面容解鎖。
Digital Garage董事伊藤穰一指出了依賴機器學(xué)習(xí)的AI的“極限”
不過,要實現(xiàn)自動駕駛及自律型多功能機器人,相當(dāng)于頭腦的AI要具有識別眼前物體和周圍情況的能力,其中包括過去沒經(jīng)歷過的情況。
這需要基于邏輯和常識的推論能力,僅靠依賴“過去”事例的機器學(xué)習(xí)型模型并不能順利實現(xiàn)。熟悉尖端技術(shù)動向的Digital Garage公司董事伊藤穰一指出:“谷歌、特斯拉及蘋果仍很難將自動駕駛汽車推向?qū)嵱谜f明依靠機器學(xué)習(xí)的AI存在極限”。
“別說人類,就連貓狗的智能都遠(yuǎn)未達(dá)到”
對話型AI缺乏“常識”和“道理”也源于根據(jù)數(shù)據(jù)以歸納法方式探索相關(guān)類型的機器學(xué)習(xí)型AI的弱點。
兼具常識和邏輯思考的新一代AI如何才能實現(xiàn)?參考人類兒童自然掌握語言、空間認(rèn)識及社會關(guān)系等的過程,讓計算機學(xué)習(xí)邏輯和常識的研究正以腦科學(xué)家和認(rèn)知科學(xué)家也參與的跨學(xué)科途徑推進。另外,也有將在第2次AI浪潮下失敗的人類輸入邏輯和常識與尖端的深層學(xué)習(xí)相融合的嘗試。
關(guān)于通過機器實現(xiàn)與人類接近的智能這一長期目標(biāo)與現(xiàn)有AI技術(shù)的差距,開拓深層學(xué)習(xí)基本技術(shù)的美國Meta首席AI科學(xué)家、紐約大學(xué)教授Yann Lucan形容道:“目前先別說人類,就連貓狗的智能都遠(yuǎn)未達(dá)到”。
我們不能因為看到對話AI的流暢文章就誤以為AI智能已經(jīng)接近超越人類的“特異功能”(Singularity)。人類的科學(xué)技術(shù)在達(dá)到這一水平之前還需要實現(xiàn)眾多突破。
本文作者為日本經(jīng)濟新聞 編輯委員 小柳建彥
關(guān)鍵詞: chatgpt
網(wǎng)站首頁 |網(wǎng)站簡介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
Copyright © 2000-2020 hngelin.com All Rights Reserved.
中國網(wǎng)絡(luò)消費網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com
静海县| 湘阴县| 罗平县| 张家港市| 柘荣县| 西青区| 闸北区| 铁岭市| 锡林郭勒盟| 尉氏县| 土默特右旗| 任丘市| 延川县| 仪陇县| 苏尼特右旗| 安多县| 新宾| 长阳| 陆良县| 盐山县| 南陵县| 嘉鱼县| 贞丰县| 肃南| 延寿县| 兖州市| 临沂市| 侯马市| 江西省| 前郭尔| 临高县| 蛟河市| 三原县| 恩施市| 邳州市| 垫江县| 凌源市| 寿宁县| 孝昌县| 兴海县| 建瓯市|