結(jié)合Imagen Video 谷歌首次展示AI生成超分辨率長視頻

2022-11-08 09:23:33 來源：快科技編輯：

如同最近一年 DALL-E 2、Stable Diffusion 等文本生成圖像模型發(fā)展一樣，用文本來生成視頻的 AI 工具也正變得越來越多。

繼 Meta 的 Make-A-Video 之后，谷歌也接連發(fā)布了兩款視頻模型 Imagen Video 和 Phenaki。兩者分別強調(diào)視頻的質(zhì)量和長度等不同功能。

日前，在人工智能活動上，首次發(fā)布了由 Imagen Video 和 Phenaki 一同生成的視頻。該視頻結(jié)合了 Phenaki 生成長視頻能力和 Imagen 的高分辨率細(xì)節(jié)。

(來源：谷歌)

“我認(rèn)為使用一系列提示，創(chuàng)造這樣的超分辨率長視頻令人難以置信，這是一種講故事的新方式，”谷歌研究中心首席科學(xué)家兼谷歌大腦團(tuán)隊研究總監(jiān)道格拉斯·?？?)在活動中分享說，“很期待電影人或視頻故事講述者如何利用我們的技術(shù)。”

在官方博客中表示，Imagen Video 和 Phenaki 的結(jié)合是一項重要突破，它正在努力打造領(lǐng)先行業(yè)、能生成高質(zhì)量影響的工具。AI 驅(qū)動的生成模型有著無限的創(chuàng)造力，可幫助人們借助視頻、圖像工具，以他們之前無法做到的方式充分表達(dá)自身想法。

再分別簡單介紹下 Imagen Video 和 Phenaki。

據(jù)了解，Imagen Video 基于級聯(lián)視頻擴散模型來生成高清視頻。如輸入文本提示后，基本視頻擴散模型和多個時間超分辨率(Temporal Super-Resolution，TSR)及空間超分辨率(Spatial Super-Resolution，SSR)模型，分別以 40×24 像素和 3 幀/秒速度生成 16 幀視頻、以 1280×768 像素和 24 幀/秒的速度采樣，最終得到 5.3 秒的高質(zhì)量視頻。

關(guān)鍵詞：谷歌兩款視頻模型兩款視頻模型視頻模型人工智能活動視頻模型人工智能活動

相關(guān)閱讀

分享到：

版權(quán)和免責(zé)申明

凡注有"環(huán)球傳媒網(wǎng)"或電頭為"環(huán)球傳媒網(wǎng)"的稿件，均為環(huán)球傳媒網(wǎng)獨家版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載或鏡像；授權(quán)轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng)"，并保留"環(huán)球傳媒網(wǎng)"的電頭。

长腿少妇视频小说,AV大黑逼,亚洲日本精品A在线观看,国产又粗又猛又黄又湿视频

新視野

資訊

焦點