长腿少妇视频小说,AV大黑逼,亚洲日本精品A在线观看,国产又粗又猛又黄又湿视频

您當(dāng)前的位置 :環(huán)球傳媒網(wǎng)>科技 > 正文
Meta研發(fā)閩南語AI翻譯系統(tǒng) 讓說閩南語與說英語的人進(jìn)行良好對(duì)話
2022-11-01 09:29:36 來源:DeepTech深科技 編輯:

當(dāng)前的 AI 翻譯主要應(yīng)用于書面語言。但世界現(xiàn)存的幾千種語言,近一半是口頭語言。口頭語言幾乎沒有規(guī)范的書寫系統(tǒng),難以用通常方法來開發(fā)、訓(xùn)練翻譯模型。

為了應(yīng)對(duì)這一挑戰(zhàn), 建立了第一個(gè)以口語為主的閩南語 AI 翻譯系統(tǒng),其可一定程度上讓說閩南語與說英語的人,進(jìn)行良好對(duì)話。

對(duì)外表示:“口頭交流可以幫助打破人與人之間的隔閡,也有助于人們?cè)谠钪?Metaverse)中交流。”該公司當(dāng)前正在全力發(fā)展元宇宙業(yè)務(wù),甚至在 2021 年 11 月將公司名字由 改為 。如果元宇宙要取得成功,需要實(shí)現(xiàn)更加身臨其境和自然的體驗(yàn)。

據(jù)了解,開發(fā)閩南語翻譯系統(tǒng)的一個(gè)重要前提是,需要有足夠的數(shù)據(jù)。如今的機(jī)器翻譯模型大都需要海量的書面文本來做訓(xùn)練。而閩南語的文本資源較少,在收集和注釋數(shù)據(jù)方面存在不足。

因此,研究者決定利用高資源語言的數(shù)據(jù)來解決這一問題。他們選擇使用普通話作為中介,即將閩南語轉(zhuǎn)為普通話后,再譯成相應(yīng)的另一語言。該方法極大提高了模型的性能。

另外, 還采用了一種語音挖掘的訓(xùn)練數(shù)據(jù)生成方法,借助預(yù)訓(xùn)練的語音編碼器,將閩南語和其他語言嵌入到同一語義空間中。這樣,即使閩南語沒有文字形式,其也能和英語或語義相似的文本對(duì)應(yīng)。

值得一提的是, 還為非書面語言翻譯開發(fā)了一種新的建模方法。

據(jù)了解,目前的語音翻譯模型開發(fā),大都需要借助轉(zhuǎn)錄或語音生成文本系統(tǒng)。但由于口頭語言缺少規(guī)范的文字,因此, 將重點(diǎn)放在了語音到語音的翻譯上。

研究人員使用“語音到單元的轉(zhuǎn)換”(Speech-to-Unit Translation,S2UT)方法,把輸入的語音變成許多聲學(xué)單元。然后,再讓聲學(xué)單元產(chǎn)生波形。此外,他們還采用雙通道解碼機(jī)制,分別用來生成單元和以相關(guān)語言(普通話)生成文本。

接著, 對(duì)閩南語翻譯系統(tǒng)的準(zhǔn)確性做了評(píng)估。一般來說,語音翻譯系統(tǒng)的評(píng)估采用的是 ASR-BLEU 指標(biāo)。該指標(biāo)指的是,用自動(dòng)語音識(shí)(ASR Automatic Speech Recognition)將翻譯的語音轉(zhuǎn)換成文本,再對(duì)比轉(zhuǎn)換文本與人工翻譯文本,從而計(jì)算 BLEU 分?jǐn)?shù)。BLEU 全稱為 Bilingual evaluation understudy(雙語評(píng)價(jià)替補(bǔ)),是一種標(biāo)準(zhǔn)的機(jī)器翻譯指標(biāo)。

關(guān)鍵詞: Meta開創(chuàng)非書面語言翻譯新方法 非書面語言翻譯新方法 書面語言翻譯 語言翻譯

分享到:
版權(quán)和免責(zé)申明

凡注有"環(huán)球傳媒網(wǎng)"或電頭為"環(huán)球傳媒網(wǎng)"的稿件,均為環(huán)球傳媒網(wǎng)獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng)",并保留"環(huán)球傳媒網(wǎng)"的電頭。

Copyright ? 1999-2017 cqtimes.cn All Rights Reserved 環(huán)球傳媒網(wǎng)-重新發(fā)現(xiàn)生活版權(quán)所有 聯(lián)系郵箱:8553 591@qq.com