Meta推出新的AI模型 可轉(zhuǎn)錄和翻譯近百種語言

Meta去年發(fā)布了支持200種語言的文本到文本的翻譯模型。它開發(fā)了用于多語言語音到語音翻譯的數(shù)據(jù)集,以及用于語音識別的大規(guī)模多語言語音

近日,Meta發(fā)布了一個名為SeamlessM4T的人工智能AI)模型,可以翻譯和轉(zhuǎn)錄近百種語言。據(jù)Meta介紹,SeamlessM4T可以翻譯近100種語言的語音到文本和文本到文本。對于語音轉(zhuǎn)語音和文本轉(zhuǎn)語音的操作,它可以識別100種輸入語言,并將其轉(zhuǎn)換為35種輸出語言。

SeamlessM4T是根據(jù)知識共享許可(CC) 協(xié)議4.0發(fā)布的,允許研究人員對其進(jìn)行迭代。

Meta推出新的AI模型 可轉(zhuǎn)錄和翻譯近百種語言

對于SeamlessM4T模型,Meta研究人員在一篇研究論文中表示,他們從400萬小時的原始音頻中收集了音頻訓(xùn)練數(shù)據(jù),這些音頻來自一個公開的抓取網(wǎng)絡(luò)數(shù)據(jù)存儲庫,但沒有說明是哪個存儲庫。Meta表示,SeamlessM4T代表了一個重大突破,因為這個模型可以一次性完成整個翻譯任務(wù),而不像其他大型翻譯模型那樣,將翻譯分成不同的系。

SeamlessM4T建立在Meta之前的翻譯模型之上。Meta去年發(fā)布了支持200種語言的文本到文本的翻譯模型。它開發(fā)了用于多語言語音到語音翻譯的數(shù)據(jù)集,以及用于語音識別的大規(guī)模多語言語音。Meta去年展示了它的通用語音翻譯器,可將閩南語轉(zhuǎn)化為英語。

本文來自投稿,不代表科技訊立場,如若轉(zhuǎn)載,請注明出處:http://m.2079x.cn/article/577012.html

潮玩君的頭像潮玩君管理團(tuán)隊

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論