當AI擁有“想象力”是一種什么樣的體驗?
像左上角這樣,只給出一個凳子的椅座部分,AI就很快就腦補出了一張完整的三維椅子模型:
類似的,當面對經(jīng)典的“用PS讓大象轉(zhuǎn)身”的甲方需求,我們拿到了這樣一張汽車屁股的照片:
AI也可以根據(jù)已有的局部信息,迅速推斷出缺失部分,并最終建模得到一個3D汽車模型。
這項研究成果來自深圳大學黃慧教授帶領(lǐng)的研究團隊,其論文最近剛剛被計算機視覺領(lǐng)域的頂級會議CVPR 2022接收,論文的第一作者為深圳大學視覺計算中心的研究助理閆星光。
接下來,就來一起看看一張局部照片是如何一步一步變?yōu)檎w建模的。
一個完整的三維建模的形狀通常是通過相機探測和表面取樣獲得的,而局部照片就意味著只能從物體的可見部分獲得信息,導致了不同的采樣密度和缺失。
那么這時,就要通過觀察已有數(shù)據(jù)中的非局部的提示,使用各種形式的先驗知識推斷出缺失部分。
于是,作者首先提出了一種矢量量化(Vector Quantization)的深度隱式函數(shù)(Deep Implicit Function),VQDIF。
這是一種三維表示方法,可以將表面形狀洗漱地編碼為離散的二元組序列,每個序列代表一個局部特征的位置和內(nèi)容,也就是這樣一個過程:
其次,作者提出了一個基于Transformer的自回歸模型,ShapeFormer,基于上一步中生成的二元組序列,順序地預測出完整序列的分布。
這里的Transformer是2014年的一個模型,能夠利用注意力機制(Attention)來提高模型訓練速度,最初一經(jīng)推出就在自然語言理解領(lǐng)域(NLP)取得了突破性進展,近幾年也有不少將其應用在計算機視覺領(lǐng)域(CV)的跨界研究。
而通過對上一步所預測出的分布進行抽樣,可以得到不同的預測結(jié)果。
除了像桌椅這種平面形狀,AI也在訓練中學會了對稱性、空心、填充等不少技能,因此也可以生成像是茶壺或水壺這樣的三維模型。
作者也在論文中表示,比起已有的許多三維圖像生成方法,ShapeFormer產(chǎn)生的結(jié)果可以保留更多的原圖細節(jié)。
同時,這種AI的“想象力”也極為豐富,比如面對人類這樣一個姿勢具有極大不確定性的生成目標,作者從完整的模型中隨機選擇一小部分,而AI在保持觀察到身體部位的姿勢的前提下,還生成了多種可能的姿勢。
關(guān)鍵詞: AI想象力恐怖如斯 AI擁有想象力 AI擁有想象力是一種什么樣的體驗 AI想象力是什么
凡注有"環(huán)球傳媒網(wǎng)"或電頭為"環(huán)球傳媒網(wǎng)"的稿件,均為環(huán)球傳媒網(wǎng)獨家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng)",并保留"環(huán)球傳媒網(wǎng)"的電頭。
資訊
- 基特·哈靈頓將回歸出演雪諾 《權(quán)力的游戲》開發(fā)續(xù)集性質(zhì)衍生劇
- 開發(fā)智能駕駛系統(tǒng) 沉寂已久的小米汽車或有大動作?
- 全球首臺氫燃料電池鉸接式卡車來了!
- 雪糕行業(yè)的競爭愈發(fā)激烈 跨界賣雪糕已經(jīng)不是新鮮事
- “東方甄選”直播間持續(xù)火爆出圈 多家上市公司欲拋合作“橄欖枝”
- 市場占有率大幅滑落 耐克、阿迪達斯失勢
- 單月銷售環(huán)比顯著改善 房地產(chǎn)行業(yè)景氣度回升
- 啥時候量產(chǎn)?特斯拉電動卡車路試曝光
- 懷念家有老是個寶的時代!楊立新追憶藍天野
- 銀華中證港股通醫(yī)藥衛(wèi)生綜合ETF基金06月13日下跌3.82%
焦點
- 日本首相岸田文雄:央行應該堅持寬松貨幣政策
- 對抗通脹并削減赤字!白宮和民主黨人就新的經(jīng)濟計劃進行磋商
- 七星連珠天象罕見上演16至19日 凌晨四時左右構(gòu)成一條直線
- 美國抵押貸款利率創(chuàng)下三十年多來最大升幅 房地產(chǎn)市場或因此降溫
- 受俄羅斯限制供應影響 歐洲天然氣價格飆升逾20%
- 我跪下來都行! 星巴克CEO卑微懇求員工返崗
- 國際科技創(chuàng)新孵化巨頭德國漢堡建立全球首個氫能源初創(chuàng)公司孵化器
- 為了減少溫室氣體排放 新西蘭居然開始對牛羊收費!
- 鮑威爾發(fā)布會:6月政策決定是為了將通脹預期錨定在2%
- 在脫歐協(xié)議上的翻悔?歐盟對英國啟動違規(guī)程序