發布時間:2023/5/23 15:07
臉書(Meta)今天公布,旗下大規模多語言語音模型,可辨識超過4000種口語表達的語言,辨識量是既有技術的40倍;文字語音互轉技術的應用範圍,從100種語言增加至1100種,且可用於AR及VR。
世界上許多語言正面臨消失的危機,而現有的語言辨識與生成技術上的限制更加快此趨勢。Meta今天發布新聞稿指出,Meta發表一系列的AI模型,希望幫助用戶以自己習慣的語言,更輕鬆獲取資訊及使用電子裝置。
廣告 更多內容請繼續往下閱讀
Meta表示,公司研發的大規模多語言語音(Massively Multilingual Speech,簡稱MMS)模型,擴展文字轉語音及語音轉文字技術的應用範圍,從最初的100種語言,至今已可轉換超過1100種語言,超越過去的10倍。還能辨識超過4000種口語語言,是過去的40倍。
應用案例方面,從VR(虛擬實境)、AR(擴增實境)至訊息服務,不僅能使用偏好語言操作,更可理解每個人的聲音。
廣告 更多內容請繼續往下閱讀
Meta指出,將開源這項技術的原始碼及模型,讓研究社群能夠以現有的工作成果為基礎繼續開發,一同保存全球的語言,並拉近人們間的距離。
過去最大型的語音資料庫最多僅涵蓋100種語言,因此開發此技術所面臨的第一個挑戰即為「蒐集數千種語言的語音訓練資料」。為了克服這項挑戰,Meta使用已翻譯成多種語言、譯文已被廣泛閱讀及研究的宗教經典,例如「聖經」,作為語言的文字訓練資料。
Meta表示,聖經譯文有多種語言的公開錄音檔,作為大型多語言語音模型計畫的一部分,Meta創造的資料集,蒐集超過1100種語言的「新約聖經」有聲讀物資料集,平均為每種語言提供32小時的語音訓練資料,後續又加入其他未標註的基督教有聲讀物後,可用的語言訓練資料已涵蓋超過4000種語言。
Meta強調,將持續擴增大規模多語言語音模型的涵蓋範圍,以支援更多語言的轉換及辨識,並努力克服現有語音技術難以處理方言的挑戰。
(中央社)
AI資料中心訂單達200億元!「重電大廠」豪發12元股利 台電強韌電網挹注Q1 EPS飆3.29元
目標價衝330元!「封測大廠」今年EPS上看13.89元 奪輝達Vera Rubin獨家大單獲利大增
太陽能搭「AI1」衛星升空!「這檔」外資狂掃、國家隊調節近6000張 國碩漲破12%也被抽回2億元
SCFI迎連7周上漲!法人看好6月運價續高 貨櫃三雄Q2獲利看旺
5月營收翻漲近2倍!「記憶體大廠」漲停噴量21萬張 三大法人整周大投80億元搜刮
尼克睽違53年成功奪冠!紐約街頭陷入瘋狂 巴士遭燒毀、少年中槍
百萬股民歡呼了!00919、00981A公告配息由「資本利得」組成 不納入綜所稅、免繳補充保費
訂單滿到2030年!「PCB大廠」目標價喊上1000元 800G、1.6T應用報價噴2.5倍EPS攻14元
遭列處置狂跌逾22%!「這檔記憶體」獲國家隊止血搶進1.4萬張 南亞科也迎注資22億元
又一兆元IPO登陸美國!「記憶體巨頭」傳將於8月在納斯達克上市
除息首日上演「秒填息」!「這檔高息ETF」單周被國家隊出清4113張 再從00878收回12億元
晶圓代工被盯上!三大法人狠賣「這2檔」22.4萬張 連殺聯電4周回收414億元
蔣萬安喊廢監院 賴士葆列監委過去「政治辦案」紀錄:廢除已成全民共識
光電大廠「晶采」董事長驚傳辭世!公司急發重訊證實
外公是「西安事變」張學良!黃大煒生前親曝超強家世背景 拍背叮囑:要有骨氣要愛國
5月漲幅贏過大盤!「這檔主動式」外資單周押寶1.8萬張 00992A、00982A全在補貨名單
德國人大讚台灣交通!初見1「暖舉」被惹哭 喊話:外國月亮沒有比較圓
黃大煒驚傳驟逝!康康痛失19年摯友難接受 沉重回應:讓我平復一下
白宮變身格鬥場!川普豪砸19億辦80歲狂歡壽宴 學者痛批「古羅馬的麵包與馬戲」
影/王陽明大秀「超狂琴技」!?網笑:彈的很好但下次別彈了XD
您已閒置超過五分鐘,請點擊右上角關閉按鈕