最近幾年興起的所謂“生成式人工智能(generativeAI)”正吸引硅谷科技巨頭和風(fēng)投機(jī)構(gòu)的興趣,這種AI可以依據(jù)少量詞匯在幾秒鐘內(nèi)生成與之相匹配的圖像。分析師預(yù)計(jì),這種技術(shù)將被廣泛用于各行各業(yè),并產(chǎn)生數(shù)萬億美元的經(jīng)濟(jì)價值。
雖然這些計(jì)算機(jī)程序生成的圖像并不完美,比如手上出現(xiàn)多余的手指,四肢不自然的彎曲等。同時,圖像生成器在處理文本時也會遇到問題,例如生成無意義的符號等。然而,這些圖像生成程序可能是一場科技熱潮的開始。硅谷風(fēng)投機(jī)構(gòu)NextView Ventures的投資人大衛(wèi)·貝塞爾(David Beisel)說:“在過去的三個月里,‘生成式人工智能’這個詞已經(jīng)變成了流行語。”
從2021年開始,生成式AI技術(shù)取得了巨大進(jìn)步,甚至激勵許多人辭掉工作去創(chuàng)辦新公司,夢想著AI將來可以為新一代科技巨頭提供動力。
在過去五年左右的時間里,AI領(lǐng)域始終處于蓬勃發(fā)展階段,但這些進(jìn)步大多與理解現(xiàn)有數(shù)據(jù)有關(guān)。AI模型已經(jīng)變得足夠高效,可以識別人們剛剛用手機(jī)拍攝的照片中是否有一只貓。此外,這些模型也足夠可靠,每天可以為谷歌搜索引擎提供數(shù)十億次搜索結(jié)果。不過,生成式AI模型可以生成以前沒有的全新東西。換句話說,它們是在創(chuàng)造,而不僅僅是在分析數(shù)據(jù)。
AI與機(jī)器學(xué)習(xí)平臺Craiyon Productive AI的創(chuàng)建者鮑里斯·戴瑪(Boris Dayma)說:“最令人感到印象深刻的是,生成式AI也能創(chuàng)作新的東西。它們不僅僅是創(chuàng)造類似的舊有圖像,還可以創(chuàng)造與以前完全不同的新事物。”
硅谷知名風(fēng)投公司紅杉資本(Sequoia Capital)在其網(wǎng)站上發(fā)文表示:“從游戲到廣告再到法律方面,生成式AI可能會改變所有需要人類創(chuàng)造力發(fā)揮作用的領(lǐng)域。這種技術(shù)有可能產(chǎn)生數(shù)萬億美元的經(jīng)濟(jì)價值。”更為有趣的是,紅杉資本還在帖子中指出,其上述文章部分是由GPT-3撰寫的,后者本身就是能夠生成文本的生成式AI。
生成式AI的工作原理
圖像生成使用的技術(shù)來自機(jī)器學(xué)習(xí)的一個子集,稱為深度學(xué)習(xí)。自從2012年一篇關(guān)于圖像分類的里程碑式論文重新點(diǎn)燃人們對這項(xiàng)技術(shù)的興趣以來,深度學(xué)習(xí)推動了AI領(lǐng)域的大部分進(jìn)步。深度學(xué)習(xí)使用在大數(shù)據(jù)集上訓(xùn)練的模型,直到該程序理解這些數(shù)據(jù)中的關(guān)系。然后,該模型可以用于應(yīng)用程序,如識別圖片中是否有狗或翻譯文本等。
圖像生成器的工作原理就是逆轉(zhuǎn)這個過程。它們不是將英語翻譯成法語,而是將英語短語轉(zhuǎn)換成圖像。它們通常有兩個主要部分組成,一個是處理初始短語的部分,另一個是將數(shù)據(jù)轉(zhuǎn)換成圖像的部分。
第一部分生成式AI基于名為Generative Adversarial Networks(生成式對抗網(wǎng)絡(luò),簡稱GAN)的方法。此前,這些GAN通常被用于生成不存在的人的照片。本質(zhì)上,它們的工作方式是讓兩個AI模型相互競爭,以更好地創(chuàng)建符合預(yù)定目標(biāo)的圖像。
而較新的方法通常使用轉(zhuǎn)換器,這是谷歌于2017年論文中首次提出的概念。這是一項(xiàng)新興技術(shù),可以利用更大的數(shù)據(jù)集,盡管其培訓(xùn)成本可能高達(dá)數(shù)百萬美元。
第一個獲得大量關(guān)注的圖像生成器是Dall-E,它是硅谷初創(chuàng)公司OpenAI于2021年推出的項(xiàng)目。OpenAI今年發(fā)布了功能更強(qiáng)大的更新版本。專注于生成式AI的開發(fā)者克里斯蒂安·坎特雷爾(Christian Cantrell)說:“有了Dall-E 2,這真的是我們跨越恐怖谷效應(yīng)(Uncanny Valley)的時刻。”
另一個常用的、基于AI的圖像生成器是Craiyon,以前被稱為Dall-E Mini,它可以在網(wǎng)絡(luò)上買到。用戶輸入短語后,可以幾分鐘內(nèi)在瀏覽器中看到其給出的繪圖。
據(jù)AI與機(jī)器學(xué)習(xí)平臺Craiyon Productive AI的創(chuàng)建者戴瑪稱,自2021年7月推出以來,Craiyon現(xiàn)在每天生成約1000萬張圖片,總計(jì)生成10億張以前從未見過的圖片。在今年早些時候使用量飆升后,戴瑪開始將全部精力投入到Craiyon上。他說,他專注于使用廣告來保持用戶免費(fèi)使用,因?yàn)樵摼W(wǎng)站的服務(wù)器成本很高。Craiyon上有個推特賬號,專門發(fā)布最奇怪、最有創(chuàng)意的圖片,它擁有超過100萬名粉絲。
但最能激發(fā)人們熱情的項(xiàng)目是Stable Diffusion,該項(xiàng)目于今年8月向公眾發(fā)布。它的代碼可以在GitHub上獲得,可以在電腦上運(yùn)行,也可以在云端或通過編程接口運(yùn)行。這讓用戶可以根據(jù)自己的目的調(diào)整程序代碼,或者在其基礎(chǔ)上構(gòu)建新程序。
舉例來說,Stable Diffusion通過一個插件集成到Adobe Photoshop中,允許用戶生成背景和圖像的其他部分,然后他們可以使用圖層和其他PS工具直接在應(yīng)用中操作,將生成式AI從生成成品圖像的技術(shù)變成了專業(yè)人士可以使用的工具。
該插件的開發(fā)者坎特雷爾在Adobe工作了20年,今年辭職專注于生成式AI。這位資深人士表示,該插件已被下載數(shù)萬次。藝術(shù)家們告訴他,他們把它用在了無數(shù)他意想不到的地方,比如制作哥斯拉的動畫,或者以藝術(shù)家可以想象的任何姿勢創(chuàng)作蜘蛛俠的圖像。
使用生成式AI的一種新興藝術(shù)是如何構(gòu)建“提示”,即生成圖像的短語。名為Lexica的搜索引擎可以將Stable Diffusion的圖像和可用于生成它們的確切單詞字符串聯(lián)起來。Reddit和Discord等平臺上,都有如何引導(dǎo)人們輸入想要生成圖像的短語技巧。
創(chuàng)企、云服務(wù)提供商和芯片制造商或受益最大
許多投資者將生成式AI視為一種潛在的變革性平臺,就像智能手機(jī)或互聯(lián)網(wǎng)的早期一樣。這種轉(zhuǎn)變極大地擴(kuò)大了可能能夠使用這項(xiàng)技術(shù)的潛在市場規(guī)模。
坎特雷爾認(rèn)為,生成式AI類似于一種更基礎(chǔ)的技術(shù),即數(shù)據(jù)庫。他說:“生成式AI有點(diǎn)兒像數(shù)據(jù)庫,數(shù)據(jù)庫幫助解鎖了應(yīng)用程序的巨大潛力。我們生活中使用過的幾乎每款應(yīng)用都是建立在數(shù)據(jù)庫之上的,但沒有人關(guān)心數(shù)據(jù)庫是如何工作的,他們只知道如何使用它。”
Compound VC管理合伙人邁克爾·鄧普西(Michael Dempsey)表示,以前僅限于實(shí)驗(yàn)室的技術(shù)進(jìn)入主流的時刻“非常罕見”,吸引了風(fēng)險投資者的大量關(guān)注,他們喜歡在潛力巨大的領(lǐng)域下注。但他警告說,生成式AI目前處于更接近炒作周期頂峰的“好奇心階段”。處于這個階段的公司可能會倒閉,因?yàn)樗鼈儧]有專注于企業(yè)或消費(fèi)者愿意付費(fèi)的特定用途。
該領(lǐng)域的其他人認(rèn)為,今天開創(chuàng)這些技術(shù)的初創(chuàng)公司最終可能會挑戰(zhàn)目前主導(dǎo)AI領(lǐng)域的軟件巨頭,包括谷歌、Facebook母公司Meta以及微軟,并為下一代科技巨頭的崛起鋪平道路。
Hugging Face首席執(zhí)行官克萊門特·德蘭格(Clement Delangue)說:“將會有一大批價值萬億美元的新公司誕生,這些初創(chuàng)公司將以這種新的技術(shù)為基礎(chǔ)。”Hugging Face是個與GitHub類似的開發(fā)者平臺,托管著預(yù)先培訓(xùn)的AI模型,包括Craiyon和Stable Diffusio。它的目標(biāo)是讓程序員更容易構(gòu)建AI技術(shù)。
有些公司已經(jīng)獲得了大量投資。Huging Face在今年早些時候從Lux Capital和紅杉資本等投資者那里籌集了資金后,估值達(dá)到20億美元。該領(lǐng)域最著名的初創(chuàng)公司OpenAI已經(jīng)從微軟和Khosla Ventures獲得了超過10億美元的資金。與此同時,Stable Diffusion開發(fā)商Stability AI正在洽談以高達(dá)10億美元的估值籌集風(fēng)險資金。
亞馬遜、微軟和谷歌等云服務(wù)提供商也可能受益,因?yàn)樯墒紸I可能是計(jì)算密集型技術(shù)。Meta和谷歌已經(jīng)聘請了該領(lǐng)域諸多杰出人才,希望將這種先進(jìn)技術(shù)整合到公司的產(chǎn)品中。今年9月,Meta宣布了名為“Make-A-Video”的AI計(jì)劃,通過生成視頻而不僅僅是圖像,使這項(xiàng)技術(shù)更上一層樓。
Meta首席執(zhí)行官馬克·扎克伯格(Mark Zuckerberg)在他的Facebook頁面上發(fā)帖稱:“這是一個令人驚嘆的進(jìn)步。生成視頻比生成照片難得多,因?yàn)槌苏_生成每個像素之外,系統(tǒng)還必須預(yù)測它們會隨著時間的推移發(fā)生怎樣的變化。”最近,谷歌也發(fā)布了名為Phenaki的程序代碼,可以將文本轉(zhuǎn)換為時長幾分鐘的視頻。
這股熱潮也可能給英偉達(dá)、AMD和英特爾等芯片制造商帶來提振,他們的圖形處理器是訓(xùn)練和部署AI模型的理想選擇。在上周的會議上,英偉達(dá)首席執(zhí)行官黃仁勛強(qiáng)調(diào),生成式AI是該公司最新芯片的關(guān)鍵用途,并稱這類技術(shù)可能很快就會給通信領(lǐng)域帶來革命性的變化。
不過,生成式AI為終端用戶帶來的好處依然有限。如今許多令人興奮的事情都圍繞著免費(fèi)或低成本的實(shí)驗(yàn)進(jìn)行。例如,有些作者已經(jīng)嘗試使用圖像生成器為文章制作插圖。英偉達(dá)正嘗試使用模型來生成新的人、動物、車輛或家具的3D圖像,這些圖像可以填充到虛擬游戲世界中。
凡注有"環(huán)球傳媒網(wǎng)"或電頭為"環(huán)球傳媒網(wǎng)"的稿件,均為環(huán)球傳媒網(wǎng)獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng)",并保留"環(huán)球傳媒網(wǎng)"的電頭。
- 生成式AI火了 倫理問題難應(yīng)對
- 印度汽車制造商提議將從英國進(jìn)口的汽車關(guān)稅稅率降低至30%
- 再創(chuàng)月度交付新記錄!特斯拉中國9月交付超8.3萬輛
- 一分錢沒自留!當(dāng)當(dāng)網(wǎng)李國慶曝一年賺上千萬
- 鑲嵌勞力士手表的iPhone14Pro賣93萬 “富豪智商檢測機(jī)“來了!
- 最重要的是盈利?蝦皮離盈利還有多久
- 各大金飾品牌都爭相做起優(yōu)惠活動 買金熱背后的定價“套路”
- 有色金屬行業(yè)運(yùn)行情況回顧 銅庫存水平偏低供給側(cè)偏緊
- 你期待嗎?3年后花200萬可太空旅行?
- 土衛(wèi)二的冰下海洋中可能含有豐富的溶解態(tài)磷酸根
資訊
- 有行業(yè)龍頭去年?duì)I收超80億?節(jié)后11只新股齊發(fā)!
- 被字節(jié)收購一年后 pico第一次交出了成績單
- 熱門中概股普遍下跌 BOSS直聘下跌11.71%
- 納斯達(dá)克指數(shù)收于10802.92點(diǎn)跌幅0.60%
- 商家報名9月26日開啟!2022天貓雙11:跨店每滿300減50
- 咋回事?馬斯克、推特CEO雙雙推遲庭審前問詢
- 豐田主動出手化解批評 電動轉(zhuǎn)型慢引投資者不滿
- 綜藝“吸金”大縮水 “綜N代”招商口碑雙下滑
- 賈躍亭驅(qū)除惡意董事拯救公司 FF重組董事會再獲1億美金融資
- 累計(jì)募資超百億 零跑科技或定價48港元
焦點(diǎn)
- 瑞信(CS.US)CEO發(fā)表備忘錄 試圖讓市場相信其財務(wù)穩(wěn)定性
- 財務(wù)大臣重申捍衛(wèi)日元立場 日本央行9月政策會議摘要提及政策轉(zhuǎn)向
- 英國迎來黃金搶購潮 新政府“迷你預(yù)算”刮起恐慌風(fēng)暴
- 高盛:美國家庭和外國投資者將分別凈拋售1000億美元股票
- 違約概率飆升至至少10年來最高水平 百年銀行巨頭瑞信被傳“爆雷”!
- 美聯(lián)儲在加息速度問題上已現(xiàn)分歧 市場Q4能否扭轉(zhuǎn)頹勢?
- 進(jìn)一步加碼全球黃油市場 威士蘭乳業(yè)收購新西蘭乳企Canary Foods
- 國際能源署警告:歐洲在今年冬天將面臨“史無前例”的天然氣短缺風(fēng)險
- 歐盟能源監(jiān)管機(jī)構(gòu)合作局:勢將為每日電價設(shè)定一個上限
- 能源價格暴漲139%!德國8月PPI同比飆升45.8%創(chuàng)歷史最大漲幅