日本人妻久久中文字幕精品,黄色内裤逼里插着的好看,手机在线观看一级午夜片,日韩免费久久人妻一区网站

網(wǎng)絡(luò)消費網(wǎng) >  科技 > > 正文
谷歌報復(fù)性砸出5620億參數(shù)大模型!比ChatGPT更恐怖 機(jī)器人都能用 學(xué)術(shù)圈已刷屏
時間:2023-03-10 16:08:32

為應(yīng)對新一輪技術(shù)競賽,谷歌還在不斷出后手。


【資料圖】

這兩天,一個名叫PaLM-E的大模型在AI學(xué)術(shù)圈瘋狂刷屏。

它能只需一句話,就讓機(jī)器人去廚房抽屜里拿薯片。

即便是中途干擾它,它也會堅持執(zhí)行任務(wù)。

PaLM-E擁有5620億參數(shù),是GPT-3的三倍多,號稱史上最大規(guī)模視覺語言模型。而它背后的打造團(tuán)隊,正是谷歌和柏林工業(yè)大學(xué)。

作為一個能處理多模態(tài)信息的大模型,它還兼具非常強(qiáng)的邏輯思維。

比如能從一堆圖片里,判斷出哪個是能滾動的。

還會看圖做算數(shù):

有人感慨:

這項工作比ChatGPT離AGI更近一步??!

而另一邊,微軟其實也在嘗試ChatGPT指揮機(jī)器人干活。

這么看,谷歌是憑借PaLM-E一步到位了?

邏輯性更強(qiáng)的大模型

PaLM-E是將PaLM和ViT強(qiáng)強(qiáng)聯(lián)合。

5620億的參數(shù)量,其實就是如上兩個模型參數(shù)量相加而來(5400億+220億)。

PaLM是谷歌在22年發(fā)布的語言大模型,它是Pathways架構(gòu)訓(xùn)練出來的,能通過“思考過程提示”獲得更準(zhǔn)確的邏輯推理能力,減少AI生成內(nèi)容中的錯誤和胡言亂語。

Pathways是一種稀疏模型架構(gòu),是谷歌AI這兩年重點發(fā)展方向之一,目標(biāo)就是訓(xùn)練出可執(zhí)行成千上百種任務(wù)的通用模型。

ViT是計算機(jī)視覺領(lǐng)域的經(jīng)典工作了,即Vision Transformer。

兩者結(jié)合后,PaLM-E可以處理多模態(tài)信息。包括:

語言

圖像

場景表征

物體表征

通過加一個編碼器,模型可以將圖像或傳感器數(shù)據(jù)編碼為一系列與語言標(biāo)記大小相同的向量,將此作為輸入用于下一個token預(yù)測,進(jìn)行端到端訓(xùn)練。

具體能力方面,PaLM-E表現(xiàn)出了比較強(qiáng)的邏輯性。

比如給它一張圖片,然后讓它根據(jù)所看到的做出蛋糕。

模型能先判斷出圖像中都有什么,然后分成9步講了該如何制作蛋糕,從最初的磕雞蛋到最后洗碗都包括在內(nèi)。

有人還調(diào)侃說,這機(jī)器人怎么在把蛋糕給我前先自己吃了?

還有根據(jù)圖片做判斷:我能在這條路上騎自行車嗎?

模型進(jìn)行一系列邏輯推斷:

1、不能進(jìn)入

2、除了自行車

3、除了自行車以外都不能進(jìn)入

4、答案是可以

這和人類思考的過程確實很像了。

不僅如此,模型的最強(qiáng)大之處在于,它無需經(jīng)過預(yù)處理,即提前理解環(huán)境。

它做出判斷和回答,完全是基于它自己的“經(jīng)驗”。

研究人員表示,這項成果表現(xiàn)出了很強(qiáng)的正向遷移(positive transfer)能力。

在多個領(lǐng)域任務(wù)的訓(xùn)練中,PaLM-E的表現(xiàn)都優(yōu)于單項任務(wù)機(jī)器人模型。

而且他們還發(fā)現(xiàn),語言模型的規(guī)模越大,它最終能保持的語言理解能力越強(qiáng)。

比如使用5400億參數(shù)規(guī)模的PaLM時,PaLM-E在語言任務(wù)上的實際能力僅下降了3.9%。

從實驗結(jié)果來看,PaLM-E在OK-VQA基準(zhǔn)上達(dá)到新SOTA。

在模擬環(huán)境下的任務(wù)完成度也都不錯。

再次驗證大力出奇跡

目前這項研究已引發(fā)非常廣泛的討論。

主要在于以下幾個方面:

1、一定程度上驗證了“大力出奇跡”

2、比ChatGPT更接近AGI?

一方面,作為目前已知的規(guī)模最大的視覺語言模型,PaLM-E的表現(xiàn)已經(jīng)足夠驚艷了。

去年,DeepMind也發(fā)布過一個通才大模型Gota,在604個不同的任務(wù)上接受了訓(xùn)練。

但當(dāng)時有很多人認(rèn)為它并不算真正意義上的通用,因為研究無法證明模型在不同任務(wù)之間發(fā)生了正向遷移。

論文作者表示,這或許是因為模型規(guī)模還不夠大。

如今,PaLM-E似乎完成了這一論證。

不過也有聲音擔(dān)心,這是不是把卷參數(shù)從NLP引到了CV圈?

另一方面,是從大趨勢上來看。

有人表示,這項工作看上去要比ChatGPT更接近AGI啊。

的確,用ChatGPT還只是提供文字建議,很多具體動手的事還要自己來。

但PaLM-E屬于把大模型能力拉入到具象化層面,AI和物理世界之間的結(jié)界要被打破了。

而且這個趨勢顯然也是大家都在琢磨的,微軟前不久也發(fā)布了一項非常相似的工作——讓ChatGPT指揮機(jī)器人。

除此之外,還有很多人表示,這再一次驗證了多模態(tài)是未來。

不過,這項成果現(xiàn)在只有論文和demo發(fā)布,真正能力有待驗證。

此外還有人發(fā)現(xiàn),模型驅(qū)動的機(jī)器人,背后的開發(fā)團(tuán)隊在幾周前被谷歌一鍋端了。。。

所以關(guān)于PaLM-E的更多后續(xù),咱們還得再蹲蹲看。

關(guān)鍵詞:

版權(quán)聲明:
    凡注明來網(wǎng)絡(luò)消費網(wǎng)的作品,版權(quán)均屬網(wǎng)絡(luò)消費網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來源:網(wǎng)絡(luò)消費網(wǎng)"。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
    除來源署名為網(wǎng)絡(luò)消費網(wǎng)稿件外,其他所轉(zhuǎn)載內(nèi)容之原創(chuàng)性、真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考并自行核實。
熱文

網(wǎng)站首頁 |網(wǎng)站簡介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
 

Copyright © 2000-2020 hngelin.com All Rights Reserved.
 

中國網(wǎng)絡(luò)消費網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
 

聯(lián)系郵箱:920 891 263@qq.com

備案號:京ICP備2022016840號-15

營業(yè)執(zhí)照公示信息

方城县| 卢氏县| 临湘市| 云南省| 舞钢市| 车致| 桂东县| 大埔区| 双流县| 河曲县| 滨州市| 志丹县| 睢宁县| 泰宁县| 镇平县| 驻马店市| 丰宁| 台南县| 屯门区| 南溪县| 临沧市| 崇义县| 福鼎市| 望江县| 浙江省| 平利县| 洪湖市| 康乐县| 长岭县| 西充县| 保德县| 泸溪县| 延安市| 依兰县| 宜都市| 金川县| 银川市| 深水埗区| 本溪| 新晃| 马龙县|