南方財經(jīng)全媒體記者江月 上海報道
“百模大戰(zhàn)”不足以形容2023年的AI模型訓(xùn)練熱潮,行業(yè)蓬勃程度突破想象。
8月末,南方財經(jīng)全媒體記者從開源代碼平臺Hugging Face內(nèi)部人士處了解到,在過去8個月里,Hugging Face上的預(yù)訓(xùn)練模型數(shù)量從此前積累的10萬個增長到了超過30萬個,數(shù)據(jù)集從1萬個增長至5.8萬個,估值也從20億美元飆升到45億美元。
Hugging Face正逐步成為全球最大的大模型庫。8月末,Hugging Face宣布最新一輪融資成功,共籌集到2.35億美元,公司估值較去年同期上漲1倍至45億美元,投資方包括Salesforce、谷歌、IBM、亞馬遜等科技巨頭,英偉達、英特爾、AMD、高通等芯片公司以及知名風(fēng)險投資機構(gòu)Sound Ventures等。
盡管對話式機器人ChatGPT率先引發(fā)了全球關(guān)注,但全球開發(fā)者的AI模型研究,目前不限于語言類,還包括圖像生成、聲音生成和轉(zhuǎn)移、視頻生成等。這反映,人工智能開發(fā)者仍然在從不同方向挖掘市場需求點,未來還可能出現(xiàn)新的“爆款應(yīng)用”。
AI融資加速
Hugging Face在2023年乘AIGC東風(fēng)而上,它被稱為AI領(lǐng)域的GitHub,今年銷售量大增,且加快融資速度、身價倍增。
一名Hugging Face內(nèi)部人士近期告訴南方財經(jīng)全媒體記者,截至8月底,在Hugging Face平臺上公開的人工智能模型數(shù)量已經(jīng)超過30萬個,未公開的數(shù)量甚至更多。另外,數(shù)據(jù)集也達到5.8萬個。公司也在迅速擴張,團隊人數(shù)從去年的30人擴張到了160多人。
與去年年末的數(shù)據(jù)相比,這意味著在2023年前8個月,該平臺上的預(yù)訓(xùn)練模型數(shù)量增長200%,數(shù)據(jù)集數(shù)量增長接近500%。
該人士介紹,Hugging Face目前對業(yè)界提供模型托管、社區(qū)交流,仍在圍繞AI發(fā)展完善各種功能。在中國,Hugging Face也深入社區(qū)交流、提供免費的課程,從而促進當(dāng)?shù)赜信d趣的開發(fā)者加速流入行業(yè),也盡早推廣“人人使用AI”的理念。
此前有市場消息還稱,Hugging Face今年的ARR(年度經(jīng)常性收入)可能達到4000萬美金左右。Hugging Face首席執(zhí)行官克萊門特·德朗格(Clément Delangue)近期預(yù)計,2023年總收入將為2022年的五倍,因為市場需求十分旺盛。據(jù)Hugging Face此前披露,包括微軟、谷歌、Bloomberg、英特爾等各個行業(yè)超過1.5萬家機構(gòu)都成為它的用戶,而其中付費用戶已有3000多家。
全球今年,一級市場加速對人工智能產(chǎn)業(yè)的投資。風(fēng)投數(shù)據(jù)分析公司PitchBook稱,2023上半年,全球人工智能領(lǐng)域共計發(fā)生融資1387件,籌集融資金額255億美元,平均融資金額達2605萬美元。如要分析業(yè)務(wù)結(jié)構(gòu),以硅谷的AI創(chuàng)業(yè)公司為例,分為基礎(chǔ)大模型層、中間層和垂直場景應(yīng)用層三種,盡管基礎(chǔ)大模型層產(chǎn)生了OpenAI這樣的獨角獸,但從事中間層數(shù)據(jù)庫、工具包以及應(yīng)用層的公司,也不乏亮點。
Hugging Face由法國連續(xù)創(chuàng)業(yè)者德朗格和兩位伙伴在2016年創(chuàng)辦,NBA球星杜蘭特是其天使融資者之一;2018年5月,它又獲得了400萬美元的種子輪融資;2019年12月,Hugging Face拿到了總額1500萬美元的A輪融資;2022年5月10日,Hugging Face宣布C輪融資籌集了1億美元,估值達到20億美元。2023年8月的最新一輪融資,是該公司單筆融資規(guī)模最大的一筆,也令估值達到45億美元。
值得留意的是,以往融資中,財務(wù)投資者比重高;這一次,新一輪投資中出現(xiàn)諸多科技巨頭面孔。以領(lǐng)銜投資的Salesforce為例,這家企業(yè)級軟件開發(fā)巨頭近來也在持續(xù)提升產(chǎn)品中的AI功能,包括通過網(wǎng)站頁面上下文生成銷售電子郵件、回復(fù)建議提供、自動總結(jié)與客戶的對話摘要等。此外,諸多本形成競爭關(guān)系的科技巨頭同時投資了該公司,反映業(yè)內(nèi)希望通過促進AI發(fā)展,給科技界帶來新的增長機遇。
AI開源模型迅速增長
AI模型開發(fā),成為2023年上半年全球關(guān)注的科技熱點。一方面,開源與閉源的優(yōu)劣比較被再次搬上舞臺;另一方面,AI模型開發(fā)之后如何進行應(yīng)用落地,得到諸多探討。
Hugging Face成立于2016年,但推動人工智能模型“開源”開始于2018年底。當(dāng)年11月,谷歌宣布推出預(yù)訓(xùn)練大語言模型BERT,瞬間成為了自然語言理解領(lǐng)域最“紅”的模型,但初期只有TensorFlow版本。Hugging Face創(chuàng)始人之一Thomas Wolf完成并開源了PyTorch版本的BERT,這吸引了大量開發(fā)者涌入Hugging Face。
在ChatGPT走紅之后,Hugging Face繼續(xù)吸納更多開發(fā)者涌入,不少人集中在機器學(xué)習(xí)、AI大模型開發(fā)上。由于Hugging Face支持大文件的上傳、免費提供hosting(網(wǎng)站托管)、免費提供全球CDN(內(nèi)容分發(fā)網(wǎng)絡(luò)),還可以一鍵部署,也就是點一下鼠標(biāo)就將模型快速地布署到亞馬遜云上,從而很快將模型使用起來,因此受到開發(fā)者歡迎。
不過,開源和閉源的優(yōu)劣之爭也在持續(xù)。
目前,“開源”模式獲得不少知名公司和機構(gòu)的支持,例如Meta旗下的LLaMA、斯坦福大學(xué)旗下Alpaca、Databricks旗下Dolly 2.0等均已經(jīng)公開了“算法”。
“開源生態(tài)的好處在于,它集思廣益,今天你發(fā)現(xiàn)一個漏洞、明天他發(fā)現(xiàn)一個功能增補,貢獻者在看著大模型獲得點贊以及落地應(yīng)用時,將獲得很大的成就感?!币晃婚_源社區(qū)的經(jīng)營者告訴南方財經(jīng)全媒體記者。
不過,支持“閉源”的人士也有自己的理由。例如,2023年紅遍全球的GPT大語言模型,于3月14日發(fā)布了GPT-4版本,這個模型選擇了“閉源”模式,這其中有安全性、版權(quán)和商業(yè)競爭的復(fù)雜考量。
大模型“開源”,到底開放的是什么樣的資源?開源字面意思是“公開源代碼”。例如Linux操作系統(tǒng)所開放的就是操作系統(tǒng)內(nèi)核源代碼。
大語言模型開放,則更為復(fù)雜。業(yè)界認(rèn)為,核心在于“算法”加上“參數(shù)”,算法的核心部分主要包括模型結(jié)構(gòu)和訓(xùn)練方法,而參數(shù)更是極難獲得、高質(zhì)量的人工標(biāo)注數(shù)據(jù)。由于大模型的核心構(gòu)成包括算法、算力和數(shù)據(jù)這三駕馬車,因此缺少任何一樣元素都難以“復(fù)制”目標(biāo)大模型。
支持大模型以開源形式發(fā)展的人士普遍認(rèn)為,開源模型下的數(shù)據(jù)集依然透明,這對于使用者是一個便利,這樣的數(shù)據(jù)集更容易維持觀點均衡、沒有偏頗。
在AI模型大量涌現(xiàn)之后,應(yīng)用落地將在不遠(yuǎn)的將來吸引更多人的注意。記者在Hugging Face上注意到,盡管語言大模型因?qū)υ挋C器人率先受到大眾關(guān)注,但開發(fā)者并不局限于這一領(lǐng)域,而是對圖像、聲音、視頻以及多模態(tài)模型各有涉獵。
如何產(chǎn)生更多像ChatGPT的“爆款”應(yīng)用?“從事AI模型落地,一方面要在市場上尋找需求,另一方面也不能僅通過API坐享其成模型開發(fā)成果,應(yīng)當(dāng)更關(guān)注數(shù)據(jù)庫的建立?!币幻P烷_發(fā)工程師如是向南方財經(jīng)全媒體介紹。
關(guān)鍵詞:
凡注有"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"或電頭為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的稿件,均為環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶獨家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶",并保留"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的電頭。
- 逐浪 AIGC|Hugging Face匯聚30萬個AI模2023-09-01
- 世界快消息!以多品牌開拓平價走量市場 新2023-09-01
- 2023年科研助理崗位已吸納應(yīng)屆高校畢業(yè)生超2023-09-01
- 哈爾濱市氣溫又殺“回馬槍”,2日最高氣溫22023-09-01
- 哈爾濱市醫(yī)保局解讀門診慢性病政策2023-09-01
- 蔣萬安上海行意猶未盡:期待下次再來2023-09-01
- 民生直通車丨跨省就醫(yī)、交通出行、文旅購票2023-09-01
- 國家疾控局印發(fā)《兒童青少年近視防控公共衛(wèi)2023-09-01
- 煤電“三改聯(lián)動”完成“十四五”目標(biāo)八成以2023-09-01
- 四部門印發(fā)通知部署2023年秋季學(xué)校食品安全2023-09-01
- 中央氣象臺9月1日06時繼續(xù)發(fā)布暴雨黃色預(yù)警2023-09-01
- 中央氣象臺9月1日06時繼續(xù)發(fā)布臺風(fēng)紅色預(yù)警2023-09-01
- 受臺風(fēng)“蘇拉”影響 香港多個公共服務(wù)部門2023-09-01
- 中信銀行鄭州分行縱深推進“資金鏈”治理,2023-09-01
- 華天科技董秘回復(fù):有,公司封裝技術(shù)水平及2023-09-01
- 地方債發(fā)行提速 銀行間流動性邊際趨緊2023-09-01
- 王炸利好 存量首套房利率下調(diào)!一大波住房2023-09-01
- A股半年報全景圖:150家公司營收翻倍,多數(shù)2023-09-01
- 恒指牛熊街貨比(58:42)︱9月1日2023-09-01
- 企業(yè)名稱冠以“中國”“中華”等字詞,從嚴(yán)2023-09-01
- 鎮(zhèn)域經(jīng)濟大省,廣東輸給了江蘇?2023-09-01
- 東方甄選想換個朋友,俞敏洪帶隊入淘10小時2023-09-01
- 武漢、東莞等4城同日官宣“認(rèn)房不認(rèn)貸”2023-09-01
- 2023暑期檔總票房超206億元 創(chuàng)中國影史多2023-09-01
- 上海虹橋火車站停車場收費標(biāo)準(zhǔn) 虹橋火車站2023-09-01
- 女人到了四五十歲,早秋多穿針織衫真的很溫2023-09-01
- 服務(wù)型制造大有可為2023-09-01
- 【忠陽車評】讓“黑”企業(yè)的自媒體付出代價2023-09-01
- 青島天一紅旗紡機集團有限公司深耕紡織機械2023-09-01
- 寧波通商控股集團有限公司聚焦園區(qū)發(fā)展——2023-09-01
- 全球新消息丨保單連續(xù)兩年增速超過百分之八十 寵物保險市場持續(xù)升溫
- 高額彩禮娶媳婦沒幾天就跑了 彩禮詐騙盯上農(nóng)村男青年_快消息
- 沈陽警方偵破一起特大非法經(jīng)營“笑氣”案件
- 科幻電影中的科技文化和審美價值_世界時快訊
- 一次旅程游遍東北全貌 重慶“全景東北”旅游專列開行-當(dāng)前觀點
- 海關(guān)總署決定全面暫停進口日本水產(chǎn)品|今日熱訊
- 【環(huán)球播資訊】美軍集束炸彈襲擊幸存者:家園無法重建 傷痛仍未遠(yuǎn)離
- 熱門:駐馬店市第三中學(xué)開展2023—2024學(xué)年教師專業(yè)發(fā)展專家報告會活動
- 世界觀天下!星海鎮(zhèn)里“村BA” 匯聚起鄉(xiāng)村振興的磅礴力量
- 今頭條!蓄謀已久 何談?wù)\信——起底日本核污染水排海決策前后
資訊
- 王炸利好 存量首套房利率下調(diào)!一大波住房政策利好持續(xù)出爐
- 尼日爾當(dāng)局下令驅(qū)逐法國駐尼日爾大使
- 印度7月原油進口同比下降6.3%
- 八月A股收官,“金九”行情是否可期?機構(gòu)最新研判來了
- 新就業(yè)形態(tài)勞動爭議典型案例研討暨庭審觀摩現(xiàn)場會在臨沂召開
- 國信證券給予洛陽鉬業(yè)買入評級 出口受阻拖累業(yè)績 權(quán)益金事宜已解決
- 白鶴學(xué)校召開新學(xué)期全體教師大會
- 第一上海(00227.HK):上半年股東應(yīng)占虧損193.1萬港元
- 上海電影(601595)8月31日主力資金凈賣出876.98萬元
- 營收增長72.72% 比亞迪發(fā)布上半年財報
焦點
- 飲品界刮起盲盒風(fēng),有的店剛開業(yè)就要轉(zhuǎn)手
- 腫瘤患者 別著急張羅“大補”
- 成都鼓勵汽車以舊換“新”
- 【全球獨家】贏合科技跌20% 中國銀河在其今年高位維持推薦評級
- 熱點在線丨職場也有人設(shè):我在職場“立人設(shè)”
- 北京豐臺打造“行走的思政課”
- 年內(nèi)首單公募REITs發(fā)售 預(yù)計規(guī)模近94億元_環(huán)球時快訊
- 當(dāng)前短訊!抖音集團旗下汽車內(nèi)容生態(tài)全面融合:日覆蓋汽車興趣用戶3.1億
- 甩開創(chuàng)作的傲慢與偏見,照見女性的理智與情感
- 烏蘭圖雅傾力助陣2023內(nèi)蒙古民歌大會