长腿少妇视频小说,AV大黑逼,亚洲日本精品A在线观看,国产又粗又猛又黄又湿视频

您當(dāng)前的位置 :環(huán)球傳媒網(wǎng)>科技 > 正文
算力不足限制AI創(chuàng)新 學(xué)者呼吁加強(qiáng)學(xué)術(shù)界算力支持
2024-11-28 17:06:26 來(lái)源:人民郵電報(bào) 編輯:
一項(xiàng)針對(duì)全球數(shù)十家學(xué)術(shù)機(jī)構(gòu)的學(xué)者開(kāi)展的調(diào)查顯示,許多大學(xué)的科學(xué)家對(duì)人工智能(AI)研究可用的算力資源感到沮喪。

相關(guān)研究論文已于近日發(fā)布在預(yù)印本服務(wù)器arXiv上,指出學(xué)者難以接觸到最先進(jìn)的計(jì)算系統(tǒng),這可能阻礙他們開(kāi)發(fā)大型語(yǔ)言模型(LLM)和其他AI研究的進(jìn)展。

(圖片來(lái)源:nature)

具體而言,學(xué)術(shù)研究者往往沒(méi)有資源獲取足夠強(qiáng)大的圖形處理器(GPU)——這些電腦芯片常用于訓(xùn)練AI模型,且價(jià)格昂貴,可達(dá)數(shù)千美元。相比之下,大型科技公司的研究者預(yù)算更高,可以在GPU上投入更多資金。“每增加一塊GPU,就能提升更多算力。”美國(guó)布朗大學(xué)計(jì)算機(jī)科學(xué)家、該研究的合著者Apoorv Khandelwal表示,“雖然行業(yè)巨頭可能擁有數(shù)千塊GPU,但學(xué)者可能只有幾塊。”

“學(xué)術(shù)界與行業(yè)界的模型差距巨大,但本可以小得多。”美國(guó)華盛頓特區(qū)非營(yíng)利AI研究機(jī)構(gòu)EleutherAI的執(zhí)行董事Stella Biderman說(shuō)。她表示,對(duì)這一差距的研究“至關(guān)重要”。

為了評(píng)估學(xué)者可用的計(jì)算資源,研究團(tuán)隊(duì)對(duì)35家機(jī)構(gòu)的50名科學(xué)家進(jìn)行了調(diào)查。受訪者中,66%對(duì)自己的算力滿意度打了3分及以下(滿分5分)。“他們根本不滿意。”Khandelwal說(shuō)。

各大學(xué)在GPU訪問(wèn)設(shè)置上有所不同。有些學(xué)校設(shè)有供各部門和學(xué)生共享的中央計(jì)算集群,研究人員可申請(qǐng)GPU使用時(shí)間。另一些機(jī)構(gòu)可能為實(shí)驗(yàn)室成員直接購(gòu)買機(jī)器。

柱狀圖揭示了調(diào)查的結(jié)果:學(xué)者通常只能有限地訪問(wèn)圖形處理器,這進(jìn)而限制了他們訓(xùn)練機(jī)器學(xué)習(xí)模型的能力。

一些科學(xué)家表示,他們不得不等待數(shù)天才能使用GPU,并指出在項(xiàng)目截止日期前后等待時(shí)間特別長(zhǎng)。調(diào)查結(jié)果還凸顯了全球算力訪問(wèn)的差異。例如,有受訪者提到在中東地區(qū)難以找到GPU。僅有10%的受訪者表示,他們可以使用英偉達(dá)的H100GPU,這是專為AI研究設(shè)計(jì)的高端芯片。

這一障礙極大地加劇了預(yù)訓(xùn)練過(guò)程的難度,即向大型語(yǔ)言模型(LLM)輸入海量數(shù)據(jù)集的過(guò)程變得尤為困難。“由于成本高昂,大多數(shù)學(xué)者甚至不敢涉足預(yù)訓(xùn)練領(lǐng)域的研究。”Khandelwal指出。他和同事堅(jiān)信,學(xué)者在人工智能研究中帶來(lái)了獨(dú)一無(wú)二的視角,而算力的匱乏可能會(huì)嚴(yán)重制約這一領(lǐng)域的未來(lái)發(fā)展。

“為了長(zhǎng)期的增長(zhǎng)和技術(shù)發(fā)展,擁有一個(gè)健康、有競(jìng)爭(zhēng)力的學(xué)術(shù)研究環(huán)境至關(guān)重要。”美國(guó)布朗大學(xué)計(jì)算機(jī)科學(xué)和語(yǔ)言學(xué)學(xué)者、該研究的合著者Ellie Pavlick說(shuō),“相比之下,在行業(yè)研究中往往存在顯著的商業(yè)壓力,這有時(shí)會(huì)促使研究人員急于求成,減少了對(duì)未知領(lǐng)域的探索。”

研究人員還深入探究了學(xué)者如何在算力資源有限的情況下更高效地進(jìn)行利用。他們測(cè)算了在使用1至8塊GPU的低資源硬件環(huán)境下,預(yù)訓(xùn)練多個(gè)大型語(yǔ)言模型(LLM)所需的時(shí)間。盡管面臨資源限制,學(xué)者仍成功訓(xùn)練出多個(gè)模型,但這一過(guò)程耗時(shí)更長(zhǎng),并要求他們必須采用更為高效的方法。

“我們實(shí)際上可以延長(zhǎng)現(xiàn)有GPU的使用時(shí)間,從而在一定程度上彌補(bǔ)與行業(yè)界的差距。”Khandelwal說(shuō)。

“在有限的計(jì)算資源上竟然也能訓(xùn)練出比許多人預(yù)期中更大的模型,這確實(shí)令人驚嘆。”德國(guó)薩爾布呂肯薩爾蘭大學(xué)神經(jīng)顯式模型研究者Ji-Ung Lee表示。他進(jìn)一步指出,未來(lái)的研究可以聚焦小公司行業(yè)研究者的經(jīng)歷,因?yàn)樗麄兺瑯釉谟?jì)算資源獲取上面臨困境。“并非所有有能力獲取無(wú)限算力的人都能夠如愿以償。”他補(bǔ)充道。

關(guān)鍵詞:

相關(guān)閱讀
分享到:
版權(quán)和免責(zé)申明

凡注有"環(huán)球傳媒網(wǎng)"或電頭為"環(huán)球傳媒網(wǎng)"的稿件,均為環(huán)球傳媒網(wǎng)獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來(lái)源為"環(huán)球傳媒網(wǎng)",并保留"環(huán)球傳媒網(wǎng)"的電頭。

Copyright ? 1999-2017 cqtimes.cn All Rights Reserved 環(huán)球傳媒網(wǎng)-重新發(fā)現(xiàn)生活版權(quán)所有 聯(lián)系郵箱:8553 591@qq.com