日本人妻久久中文字幕精品,黄色内裤逼里插着的好看,手机在线观看一级午夜片,日韩免费久久人妻一区网站

網(wǎng)絡(luò)消費(fèi)網(wǎng) >  科技 > > 正文
假3D場景逼真到火爆外網(wǎng)!超1億像素?zé)o死角 被贊AI渲染新高度
時(shí)間:2021-10-18 17:15:43

作者 | 蕭簫 楊凈

先來看一段“視頻”,有沒有看出什么不對勁的地方?

其實(shí),這僅僅是由一組照片渲染出來的(右下角為拍攝照片)!

生成的也不僅僅是一段視頻,更是一個(gè)3D場景模型,不僅能任意角度隨意切換、高清無死角,還能調(diào)節(jié)曝光、白平衡等參數(shù),生成船新的照片:

在完全不同的場景下,例如一個(gè)坦克廠中,同樣能用一組照片渲染出逼真3D場景,相同角度與真實(shí)拍攝圖像幾乎“完全一致”:

要知道,之前蘋果雖然也做過一組照片生成目標(biāo)物體3D模型的功能,但最多就是一件物體,例如一只箱子:

這次可是整個(gè)3D場景!

這是德國埃爾朗根-紐倫堡大學(xué)的幾位研究人員做的項(xiàng)目,效果一出就火得不行,在國外社交媒體上贊數(shù)超過5k,閱讀量達(dá)到36w+。

那么,這樣神奇的效果,究竟是怎么生成的呢?

用照片還原整個(gè)3D場景圖

整體來說,這篇論文提出了一種基于點(diǎn)的可微神經(jīng)渲染流水線ADOP(Approximate Differentiable One-Pixel Point Rendering),用AI分析輸入圖像,并輸出新角度的新圖像。

在輸入時(shí),由于需要建模3D場景,因此這里的照片需要經(jīng)過嚴(yán)格拍攝,來獲取整個(gè)場景的稀疏點(diǎn)云數(shù)據(jù)。

具體來說,作者在從照片獲取點(diǎn)云數(shù)據(jù)時(shí),采用了COLMAP

先從多個(gè)不同的角度拍攝場景中的照片,其中每張照片的視角都會經(jīng)過嚴(yán)格控制。

然后采用SfM(Structure From Motion,運(yùn)動恢復(fù)結(jié)構(gòu))方法,來獲取相機(jī)內(nèi)外參數(shù),得到整個(gè)場景的3D重建數(shù)據(jù),也就是表示場景結(jié)構(gòu)的稀疏點(diǎn)云:

然后,包含點(diǎn)云等信息的場景數(shù)據(jù)會被輸入到流水線中,進(jìn)行進(jìn)一步的處理。

流水線(pipeline)主要分為三個(gè)部分:可微光柵化器、神經(jīng)渲染器和可微色調(diào)映射器。

首先,利用多分辨率的單像素點(diǎn)柵格化可微渲染器(可微光柵化器),將輸入的相機(jī)參數(shù)、重建的點(diǎn)云數(shù)據(jù)轉(zhuǎn)換成稀疏神經(jīng)圖像。

其中,模型里關(guān)于圖像和點(diǎn)云對齊的部分,采用了NavVis數(shù)據(jù)集來訓(xùn)練。

然后,利用神經(jīng)渲染器,對稀疏神經(jīng)圖像進(jìn)行陰影計(jì)算和孔洞填充,生成HDR圖片。

最后,由于不是每個(gè)設(shè)備都支持HDR畫面,因此在顯示到LDR設(shè)備之前,還需要利用基于物理的可微色調(diào)映射器改變動態(tài)范圍,將HDR圖像變成LDR圖像。

每個(gè)場景300+圖像訓(xùn)練

這個(gè)新模型的優(yōu)勢在哪里?

由于模型的所有階段都可微,因此這個(gè)模型能夠優(yōu)化場景所有參數(shù)(相機(jī)模型、相機(jī)姿勢、點(diǎn)位置、點(diǎn)顏色、環(huán)境圖、渲染網(wǎng)絡(luò)權(quán)重、漸暈、相機(jī)響應(yīng)函數(shù)、每張圖像的曝光和每張圖像的白平衡),并用來生成質(zhì)量更高的圖像。

具體到訓(xùn)練上,作者先是采用了688張圖片(包含73M個(gè)點(diǎn))來訓(xùn)練這個(gè)神經(jīng)渲染流水線(pipeline)。

針對demo中的幾個(gè)場景(火車、燈塔、游樂園、操場等),作者們分別用高端攝像機(jī)拍攝了300~350張全高清圖像,每個(gè)場景生成的像素點(diǎn)數(shù)量分別為10M、8M、12M和11M,其中5%的圖像用作測試。

也就是說,制作這樣一個(gè)3D場景,大約需要幾百張圖像,同時(shí)每張圖像的拍攝需要經(jīng)過嚴(yán)格的角度控制。

不過仍然有讀者表示,拍幾百張圖像就能用AI做個(gè)場景出來,這個(gè)速度比當(dāng)前人工渲染是要快多了。

功能上,模型既能生成可以調(diào)節(jié)參數(shù)的新角度照片,還能自動插值生成全場景的3D渲染視頻,可以說是挺有潛力的。

那么,這個(gè)模型的效果與當(dāng)前其他模型的渲染效果相比如何呢?

實(shí)時(shí)顯示1億+像素點(diǎn)場景

據(jù)作者表示,論文中采用的高效單像素點(diǎn)柵格化方法,使得ADOP能夠使用任意的相機(jī)模型,并實(shí)時(shí)顯示超過1億個(gè)像素點(diǎn)的場景。

肉眼分辨生成結(jié)果來看,采用同行幾個(gè)最新模型生成的圖片,或多或少會出現(xiàn)一些偽影或是不真實(shí)的情況,相比之下ADOP在細(xì)節(jié)上處理得都非常不錯(cuò):

從數(shù)據(jù)來看,無論是火車、操場、坦克還是燈塔場景,在ADOP模型的渲染下,在VGG、LPIPS和PSNR上幾乎都能取得最優(yōu)秀的結(jié)果(除了坦克的數(shù)據(jù))。

不過,研究本身也還具有一些局限性,例如單像素點(diǎn)渲染仍然存在點(diǎn)云稀疏時(shí),渲染出現(xiàn)孔洞等問題。

但整體來看,實(shí)時(shí)顯示3D場景的效果還是非常出類拔萃的,不少業(yè)內(nèi)人士表示“達(dá)到了AI渲染新高度”。

已經(jīng)有不少網(wǎng)友開始想象這項(xiàng)研究的用途,例如給電影制片廠省去一大波時(shí)間和精力:

(甚至有電影系的學(xué)生想直接用到畢設(shè)上)

對游戲行業(yè)影響也非常不錯(cuò):

在家就能搞3A大作的場景,是不是也要實(shí)現(xiàn)了?簡直讓人迫不及待。

還有人想象,要是能在iPhone上實(shí)現(xiàn)就好了(甚至已經(jīng)給iPhone 15預(yù)定上了):

對于研究本身,有網(wǎng)友從行外人視角看來,感覺更像是插幀模型(也有網(wǎng)友回應(yīng)說差不多是這樣):

也有網(wǎng)友表示,由于需要的圖像比較多,效果沒有宣傳中那么好,對研究潛力持保留態(tài)度:

雖然目前作者們已經(jīng)建立了GitHub項(xiàng)目,但代碼還沒有放出來,感興趣的同學(xué)們可以先蹲一波。

至于具體的開源時(shí)間,作者們表示“會在中了頂會后再放出來”。(祝這篇論文成功被頂會收錄~)

關(guān)鍵詞: 1億 渲染 AI 被贊

版權(quán)聲明:
    凡注明來網(wǎng)絡(luò)消費(fèi)網(wǎng)的作品,版權(quán)均屬網(wǎng)絡(luò)消費(fèi)網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來源:網(wǎng)絡(luò)消費(fèi)網(wǎng)"。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
    除來源署名為網(wǎng)絡(luò)消費(fèi)網(wǎng)稿件外,其他所轉(zhuǎn)載內(nèi)容之原創(chuàng)性、真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請讀者僅作參考并自行核實(shí)。
熱文

網(wǎng)站首頁 |網(wǎng)站簡介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
 

Copyright © 2000-2020 hngelin.com All Rights Reserved.
 

中國網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
 

聯(lián)系郵箱:920 891 263@qq.com

備案號:京ICP備2022016840號-15

營業(yè)執(zhí)照公示信息

库车县| 新营市| 文昌市| 云南省| 化州市| 乐平市| 闻喜县| 巫溪县| 温泉县| 襄汾县| 海安县| 准格尔旗| 黔江区| 舟曲县| 子洲县| 阿克| 中西区| 固阳县| 武川县| 榆树市| 彩票| 东兰县| 云安县| 阿拉善右旗| 廊坊市| 合作市| 孙吴县| 康乐县| 淮北市| 祥云县| 淮阳县| 得荣县| 巩留县| 武邑县| 肥西县| 长宁县| 静海县| 河西区| 岚皋县| 墨脱县| 贵南县|