算力不足限制AI創(chuàng)新　學(xué)者呼吁加強(qiáng)學(xué)術(shù)界算力支持

2024-11-28 17:06:26 來(lái)源：人民郵電報(bào) 編輯：

一項(xiàng)針對(duì)全球數(shù)十家學(xué)術(shù)機(jī)構(gòu)的學(xué)者開(kāi)展的調(diào)查顯示，許多大學(xué)的科學(xué)家對(duì)人工智能（AI）研究可用的算力資源感到沮喪。

相關(guān)研究論文已于近日發(fā)布在預(yù)印本服務(wù)器arXiv上，指出學(xué)者難以接觸到最先進(jìn)的計(jì)算系統(tǒng)，這可能阻礙他們開(kāi)發(fā)大型語(yǔ)言模型（LLM）和其他AI研究的進(jìn)展。

（圖片來(lái)源：nature）

具體而言，學(xué)術(shù)研究者往往沒(méi)有資源獲取足夠強(qiáng)大的圖形處理器（GPU）——這些電腦芯片常用于訓(xùn)練AI模型，且價(jià)格昂貴，可達(dá)數(shù)千美元。相比之下，大型科技公司的研究者預(yù)算更高，可以在GPU上投入更多資金。“每增加一塊GPU，就能提升更多算力。”美國(guó)布朗大學(xué)計(jì)算機(jī)科學(xué)家、該研究的合著者Apoorv Khandelwal表示，“雖然行業(yè)巨頭可能擁有數(shù)千塊GPU，但學(xué)者可能只有幾塊。”

“學(xué)術(shù)界與行業(yè)界的模型差距巨大，但本可以小得多。”美國(guó)華盛頓特區(qū)非營(yíng)利AI研究機(jī)構(gòu)EleutherAI的執(zhí)行董事Stella Biderman說(shuō)。她表示，對(duì)這一差距的研究“至關(guān)重要”。

為了評(píng)估學(xué)者可用的計(jì)算資源，研究團(tuán)隊(duì)對(duì)35家機(jī)構(gòu)的50名科學(xué)家進(jìn)行了調(diào)查。受訪者中，66％對(duì)自己的算力滿意度打了3分及以下（滿分5分）。“他們根本不滿意。”Khandelwal說(shuō)。

各大學(xué)在GPU訪問(wèn)設(shè)置上有所不同。有些學(xué)校設(shè)有供各部門和學(xué)生共享的中央計(jì)算集群，研究人員可申請(qǐng)GPU使用時(shí)間。另一些機(jī)構(gòu)可能為實(shí)驗(yàn)室成員直接購(gòu)買機(jī)器。

柱狀圖揭示了調(diào)查的結(jié)果：學(xué)者通常只能有限地訪問(wèn)圖形處理器，這進(jìn)而限制了他們訓(xùn)練機(jī)器學(xué)習(xí)模型的能力。

一些科學(xué)家表示，他們不得不等待數(shù)天才能使用GPU，并指出在項(xiàng)目截止日期前后等待時(shí)間特別長(zhǎng)。調(diào)查結(jié)果還凸顯了全球算力訪問(wèn)的差異。例如，有受訪者提到在中東地區(qū)難以找到GPU。僅有10％的受訪者表示，他們可以使用英偉達(dá)的H100GPU，這是專為AI研究設(shè)計(jì)的高端芯片。

這一障礙極大地加劇了預(yù)訓(xùn)練過(guò)程的難度，即向大型語(yǔ)言模型（LLM）輸入海量數(shù)據(jù)集的過(guò)程變得尤為困難。“由于成本高昂，大多數(shù)學(xué)者甚至不敢涉足預(yù)訓(xùn)練領(lǐng)域的研究。”Khandelwal指出。他和同事堅(jiān)信，學(xué)者在人工智能研究中帶來(lái)了獨(dú)一無(wú)二的視角，而算力的匱乏可能會(huì)嚴(yán)重制約這一領(lǐng)域的未來(lái)發(fā)展。

“為了長(zhǎng)期的增長(zhǎng)和技術(shù)發(fā)展，擁有一個(gè)健康、有競(jìng)爭(zhēng)力的學(xué)術(shù)研究環(huán)境至關(guān)重要。”美國(guó)布朗大學(xué)計(jì)算機(jī)科學(xué)和語(yǔ)言學(xué)學(xué)者、該研究的合著者Ellie Pavlick說(shuō)，“相比之下，在行業(yè)研究中往往存在顯著的商業(yè)壓力，這有時(shí)會(huì)促使研究人員急于求成，減少了對(duì)未知領(lǐng)域的探索。”

研究人員還深入探究了學(xué)者如何在算力資源有限的情況下更高效地進(jìn)行利用。他們測(cè)算了在使用1至8塊GPU的低資源硬件環(huán)境下，預(yù)訓(xùn)練多個(gè)大型語(yǔ)言模型（LLM）所需的時(shí)間。盡管面臨資源限制，學(xué)者仍成功訓(xùn)練出多個(gè)模型，但這一過(guò)程耗時(shí)更長(zhǎng)，并要求他們必須采用更為高效的方法。

“我們實(shí)際上可以延長(zhǎng)現(xiàn)有GPU的使用時(shí)間，從而在一定程度上彌補(bǔ)與行業(yè)界的差距。”Khandelwal說(shuō)。

“在有限的計(jì)算資源上竟然也能訓(xùn)練出比許多人預(yù)期中更大的模型，這確實(shí)令人驚嘆。”德國(guó)薩爾布呂肯薩爾蘭大學(xué)神經(jīng)顯式模型研究者Ji-Ung Lee表示。他進(jìn)一步指出，未來(lái)的研究可以聚焦小公司行業(yè)研究者的經(jīng)歷，因?yàn)樗麄兺瑯釉谟?jì)算資源獲取上面臨困境。“并非所有有能力獲取無(wú)限算力的人都能夠如愿以償。”他補(bǔ)充道。

關(guān)鍵詞：

相關(guān)閱讀

分享到：

版權(quán)和免責(zé)申明

凡注有"環(huán)球傳媒網(wǎng)"或電頭為"環(huán)球傳媒網(wǎng)"的稿件，均為環(huán)球傳媒網(wǎng)獨(dú)家版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載或鏡像；授權(quán)轉(zhuǎn)載必須注明來(lái)源為"環(huán)球傳媒網(wǎng)"，并保留"環(huán)球傳媒網(wǎng)"的電頭。

长腿少妇视频小说,AV大黑逼,亚洲日本精品A在线观看,国产又粗又猛又黄又湿视频

新視野

資訊

焦點(diǎn)