如同最近一年 DALL-E 2、Stable Diffusion 等文本生成圖像模型發(fā)展一樣,用文本來生成視頻的 AI 工具也正變得越來越多。
繼 Meta 的 Make-A-Video 之后,谷歌也接連發(fā)布了兩款視頻模型 Imagen Video 和 Phenaki。兩者分別強調(diào)視頻的質(zhì)量和長度等不同功能。
日前,在人工智能活動上,首次發(fā)布了由 Imagen Video 和 Phenaki 一同生成的視頻。該視頻結(jié)合了 Phenaki 生成長視頻能力和 Imagen 的高分辨率細(xì)節(jié)。
(來源:谷歌)
“我認(rèn)為使用一系列提示,創(chuàng)造這樣的超分辨率長視頻令人難以置信,這是一種講故事的新方式,”谷歌研究中心首席科學(xué)家兼谷歌大腦團(tuán)隊研究總監(jiān)道格拉斯·???)在活動中分享說,“很期待電影人或視頻故事講述者如何利用我們的技術(shù)。”
在官方博客中表示,Imagen Video 和 Phenaki 的結(jié)合是一項重要突破,它正在努力打造領(lǐng)先行業(yè)、能生成高質(zhì)量影響的工具。AI 驅(qū)動的生成模型有著無限的創(chuàng)造力,可幫助人們借助視頻、圖像工具,以他們之前無法做到的方式充分表達(dá)自身想法。
再分別簡單介紹下 Imagen Video 和 Phenaki。
據(jù)了解,Imagen Video 基于級聯(lián)視頻擴散模型來生成高清視頻。如輸入文本提示后,基本視頻擴散模型和多個時間超分辨率(Temporal Super-Resolution,TSR)及空間超分辨率(Spatial Super-Resolution,SSR)模型,分別以 40×24 像素和 3 幀/秒速度生成 16 幀視頻、以 1280×768 像素和 24 幀/秒的速度采樣,最終得到 5.3 秒的高質(zhì)量視頻。
關(guān)鍵詞: 谷歌兩款視頻模型 兩款視頻模型 視頻模型 人工智能活動視頻模型 人工智能活動
凡注有"環(huán)球傳媒網(wǎng)"或電頭為"環(huán)球傳媒網(wǎng)"的稿件,均為環(huán)球傳媒網(wǎng)獨家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng)",并保留"環(huán)球傳媒網(wǎng)"的電頭。
- 2022騰訊科學(xué)WE大會十周年如期舉行 希望助力基礎(chǔ)科學(xué)普及
- 部分用戶反饋Face ID出現(xiàn)問題 iOS 16又出新Bug?
- Intel處理器“內(nèi)購”功能定名Intel On Demand 氪金解鎖更多性能
- 疑似Navi 31大核心的RDNA3架構(gòu)GPU"玉照"搶先曝光
- 老外不想看到它?三星Exynos 2300至今未露面
- 摩爾線程國產(chǎn)MTT S80游戲卡開賣:16GB GDDR6顯存
- 正帆科技688596:截至9月底在手訂單為31億元 同比增長63.7%
- NVIDIA的GTX 1060占比達(dá)到7.62% 份額回升到了近幾個月的最高點
- 中國聯(lián)通、騰訊設(shè)立混改新公司 雙方均未評論
- 小米索尼聯(lián)合研發(fā)索尼IMX989 共同推動移動影像的進(jìn)步
資訊
焦點
- 首次超過美國 全球最佳大學(xué)排行榜:338所中國大學(xué)上榜
- Meta市值縮水至2017年水平 扎克伯格身價排名跌出全球前十
- “雙11”成立自營物流公司 菜鳥回應(yīng):消息不實
- 瑞信(CS.US)CEO發(fā)表備忘錄 試圖讓市場相信其財務(wù)穩(wěn)定性
- 財務(wù)大臣重申捍衛(wèi)日元立場 日本央行9月政策會議摘要提及政策轉(zhuǎn)向
- 英國迎來黃金搶購潮 新政府“迷你預(yù)算”刮起恐慌風(fēng)暴
- 高盛:美國家庭和外國投資者將分別凈拋售1000億美元股票
- 違約概率飆升至至少10年來最高水平 百年銀行巨頭瑞信被傳“爆雷”!
- 美聯(lián)儲在加息速度問題上已現(xiàn)分歧 市場Q4能否扭轉(zhuǎn)頹勢?
- 進(jìn)一步加碼全球黃油市場 威士蘭乳業(yè)收購新西蘭乳企Canary Foods