發布時間:2023/5/23 15:07
臉書(Meta)今天公布,旗下大規模多語言語音模型,可辨識超過4000種口語表達的語言,辨識量是既有技術的40倍;文字語音互轉技術的應用範圍,從100種語言增加至1100種,且可用於AR及VR。
世界上許多語言正面臨消失的危機,而現有的語言辨識與生成技術上的限制更加快此趨勢。Meta今天發布新聞稿指出,Meta發表一系列的AI模型,希望幫助用戶以自己習慣的語言,更輕鬆獲取資訊及使用電子裝置。
廣告 更多內容請繼續往下閱讀
Meta表示,公司研發的大規模多語言語音(Massively Multilingual Speech,簡稱MMS)模型,擴展文字轉語音及語音轉文字技術的應用範圍,從最初的100種語言,至今已可轉換超過1100種語言,超越過去的10倍。還能辨識超過4000種口語語言,是過去的40倍。
應用案例方面,從VR(虛擬實境)、AR(擴增實境)至訊息服務,不僅能使用偏好語言操作,更可理解每個人的聲音。
廣告 更多內容請繼續往下閱讀
Meta指出,將開源這項技術的原始碼及模型,讓研究社群能夠以現有的工作成果為基礎繼續開發,一同保存全球的語言,並拉近人們間的距離。
過去最大型的語音資料庫最多僅涵蓋100種語言,因此開發此技術所面臨的第一個挑戰即為「蒐集數千種語言的語音訓練資料」。為了克服這項挑戰,Meta使用已翻譯成多種語言、譯文已被廣泛閱讀及研究的宗教經典,例如「聖經」,作為語言的文字訓練資料。
Meta表示,聖經譯文有多種語言的公開錄音檔,作為大型多語言語音模型計畫的一部分,Meta創造的資料集,蒐集超過1100種語言的「新約聖經」有聲讀物資料集,平均為每種語言提供32小時的語音訓練資料,後續又加入其他未標註的基督教有聲讀物後,可用的語言訓練資料已涵蓋超過4000種語言。
Meta強調,將持續擴增大規模多語言語音模型的涵蓋範圍,以支援更多語言的轉換及辨識,並努力克服現有語音技術難以處理方言的挑戰。
(中央社)
兄弟你好香!傲嬌貓哥逮住弟弟「埋脖狂聞」 眾笑:原來喵星人也愛吸貓
今彩539第113300期 頭獎1注中獎
買預售屋像開盲盒?友人1年新屋驚現「百項缺失」 網推2類型風險更小
TRASH唱到一半!「超美新娘」突衝上台 親密勾他爆驚喜
婦闖阿里山鐵軌拍照被撞飛!帶團旅行社被查出「有前科」 網怒喊重懲
貨櫃三雄不同命!外資本週斥資27億搶入它 再狂敲「這檔」逾6萬張
公公皮皮挫!投信狙擊鴻海整週…提款73.1億 揮刀爆砍外界看好的「這檔」4.1萬張
大漲後成「空軍基地」?自營商週倒鴻準逾6000張 網見奇異走勢嘆:妙啊
搶C位引發黃巾之亂!采盟沉寂多日曝好消息 網狂「提1事」酸:風頭還沒過
TRASH攻蛋開唱!阿夜突激動爆粗口 「史上最大垃圾場」
外資持股比驟降7.22%!「它」4個月被倒貨百萬張 本週再被砍「股價面臨3字頭」
台鏈蘋概股再燃!投信本週慧眼攬華通 日日挺「晶圓1檔」逾4萬張摘金
尹錫悅彈劾案通過!成史上「第3位遭停職總統」 年薪2億仍可照領
被打成黑五類?外資本週豪灑00919近3萬張 「多檔正二ETF」也成俎上肉
美國明年可動支近百億協助台灣! 立委籲國防部爭取美國「退役艦艇」加強戰力
敖犬回歸詹仁雄旗下!「一個眼神就懂他」 將扛女團選秀節目導師重任
航運股恐難再有大行情?馬士基報喜分析師卻示警 網:早就跳船了
聖誕禮物!周興哲新歌MV偷藏「彩蛋女星」 網狂猜身分
國會通過彈劾!尹錫悅發聲了:為國奉獻到最後一刻
「這地區」去過就不想二訪?網見原因都認同:不太吸引人