日本人妻久久中文字幕精品,黄色内裤逼里插着的好看,手机在线观看一级午夜片,日韩免费久久人妻一区网站

網(wǎng)絡(luò)消費網(wǎng) >  科技 > > 正文
動態(tài)焦點:Meta大模型成了“科學造假發(fā)動機”
時間:2022-11-18 21:08:39

Meta最新大模型差點成了“科研造假發(fā)動機”,剛出3天就在爭議中下架。

1200億參數(shù)語言模型Galactica,在4800萬篇學術(shù)論文和各式教科書、百科等數(shù)據(jù)上訓練而來。


(資料圖)

(與太空堡壘卡拉狄加同名)

其本意是想解決學術(shù)界信息過載,幫助研究人員做信息梳理、知識推理和寫作輔助,一度被認為是“科研者的福音”,或者“寫論文的Copilot”。

But,一經(jīng)開放使用,很快就被網(wǎng)友們發(fā)現(xiàn)了大問題。

它確實能為自己生成的內(nèi)容引用文獻,但有時這個文獻并不存在,作者卻是真實存在的人

它能生成看起來像模像樣的科普文字,但內(nèi)容卻是完全錯誤的。

真空中的光速和聲速接近可還行?

著名的Gary·AI悲觀主義者·Marcus也來吐槽,Galactica把他的出生日期、教育經(jīng)歷和研究領(lǐng)域等信息全搞錯了。

對以上種種問題,馬克斯普朗克智能系統(tǒng)研究所所長Michael Black總結(jié)道:

這將開啟一個科學深度造假(deep scientific fakes)的時代。

會出現(xiàn)研究者從未寫過的虛假論文,這些論文隨后會被其他真實的論文引用,簡直亂套了。

雖然他也注意到,Galactica的開發(fā)者在每個輸出內(nèi)容后都加了“內(nèi)容可能不可靠”的警告,但“潘多拉的魔盒一旦開啟,就關(guān)不上了”。

事實上他的擔憂不無道理,AI生成內(nèi)容的速度要比人類快的多,一旦大量被搜索引擎抓取就有可能出現(xiàn)在前排,甚至被當成正確答案展示在最上面,誤導更多人。

這樣的爭議持續(xù)了兩三天,團隊只好無奈宣布Demo暫時下架,論文和源代碼繼續(xù)開放給相關(guān)領(lǐng)域研究者。

作為Meta首席科學家,LeCun對這個局面并不滿意。

與他觀點一致的網(wǎng)友認為,Galactica是有幫助且有趣的,只是被個別人濫用了。

本意是好的

Galactica由Meta AI與Papers with Code合作開發(fā)。

在論文引言部分,團隊寫到:

2022年5月,arXiv上每天平均新增516篇論文……科學數(shù)據(jù)的增長速度更是比人們的處理能力快……一個人已經(jīng)不可能讀完特定研究領(lǐng)域的論文。

搜索引擎不直接組織信息,維基百科這樣的形式需要人力來維護,研究人員持續(xù)為信息過載感到不知所措。

因此他們提出,語言大模型可以更好的存儲、組合和推理科學知識,并提出一個終極愿景:

神經(jīng)網(wǎng)絡(luò)將成為科學研究的下一代人機界面,就從這篇論文開始。

本意是好的,而且Galactica的表現(xiàn)也確實不錯。

除了文本、數(shù)學公式、代碼任務(wù)之外,它還可以執(zhí)行化學式、蛋白質(zhì)序列等多模態(tài)任務(wù)。

Galactica 1200億參數(shù)版本在許多科學類任務(wù)上性能超越OpenAI的GPT-3、DeepMin的Chinchilla與Gopher、以及開源的BLOOM。

然鵝,測試基準畢竟是死的,一旦進入生產(chǎn)環(huán)境開放給用戶,還是會出現(xiàn)開發(fā)時預料不到的情況。

問題出在哪?

在Hacker News上有人認為,語言模型終究是在“對語言建?!倍皇菍?nèi)容。

就像AI繪畫模型一樣,你讓它畫“騎馬的宇航員”它就能畫出來,雖然這不太可能發(fā)生,但是很有趣。

類似的討論也發(fā)生在Twitter上。如果你讓AI生成一篇關(guān)于“生活在太空的熊”的維基頁面,AI也會試著生成。

有人認為,不,AI需要判斷出這個要求不合理。

關(guān)鍵就在于,人們對圖片和文字的要求是不一樣的。

圖片中的內(nèi)容不合理,人們只會覺得有趣而接受。而文字的內(nèi)容錯了,那就不可接受。

LeCun則認為這種工具的用法應(yīng)該是輔助駕駛,它不會幫你寫好論文,只是幫你在過程中減輕認知負擔。

以谷歌為代表的AI大廠,近年來對大模型特別是生成式模型的發(fā)布非常謹慎,像是對話模型LaMDA和AI繪畫Imagen等都不開源、不給Demo或只給限定場景下的Demo。

另一方面,以Stable Diffusion為代表開源項目推動了整個領(lǐng)域的技術(shù)進步與應(yīng)用普及,但也在版權(quán)和生成有害內(nèi)容方面引發(fā)一些問題。

你更支持哪種做法?或者還有第三條路么?

關(guān)鍵詞: galactica meta

版權(quán)聲明:
    凡注明來網(wǎng)絡(luò)消費網(wǎng)的作品,版權(quán)均屬網(wǎng)絡(luò)消費網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來源:網(wǎng)絡(luò)消費網(wǎng)"。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責任。
    除來源署名為網(wǎng)絡(luò)消費網(wǎng)稿件外,其他所轉(zhuǎn)載內(nèi)容之原創(chuàng)性、真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考并自行核實。
熱文

網(wǎng)站首頁 |網(wǎng)站簡介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
 

Copyright © 2000-2020 hngelin.com All Rights Reserved.
 

中國網(wǎng)絡(luò)消費網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復制或建立鏡像
 

聯(lián)系郵箱:920 891 263@qq.com

備案號:京ICP備2022016840號-15

營業(yè)執(zhí)照公示信息

南宁市| 慈利县| 仙居县| 甘肃省| 嘉定区| 长顺县| 建始县| 阳山县| 喀喇沁旗| 阿勒泰市| 安顺市| 大厂| 乌兰察布市| 会理县| 玉龙| 海安县| 南京市| 勃利县| 扎兰屯市| 徐州市| 张北县| 霍山县| 芷江| 巴青县| 靖边县| 临沧市| 嫩江县| 叶城县| 肥东县| 宁陕县| 灌云县| 遵化市| 盐边县| 闻喜县| 瓮安县| 都昌县| 古田县| 开封县| 宁津县| 竹山县| 昭觉县|