發布時間:2023/5/23 15:07
臉書(Meta)今天公布,旗下大規模多語言語音模型,可辨識超過4000種口語表達的語言,辨識量是既有技術的40倍;文字語音互轉技術的應用範圍,從100種語言增加至1100種,且可用於AR及VR。
世界上許多語言正面臨消失的危機,而現有的語言辨識與生成技術上的限制更加快此趨勢。Meta今天發布新聞稿指出,Meta發表一系列的AI模型,希望幫助用戶以自己習慣的語言,更輕鬆獲取資訊及使用電子裝置。
廣告 更多內容請繼續往下閱讀
Meta表示,公司研發的大規模多語言語音(Massively Multilingual Speech,簡稱MMS)模型,擴展文字轉語音及語音轉文字技術的應用範圍,從最初的100種語言,至今已可轉換超過1100種語言,超越過去的10倍。還能辨識超過4000種口語語言,是過去的40倍。
應用案例方面,從VR(虛擬實境)、AR(擴增實境)至訊息服務,不僅能使用偏好語言操作,更可理解每個人的聲音。
廣告 更多內容請繼續往下閱讀
Meta指出,將開源這項技術的原始碼及模型,讓研究社群能夠以現有的工作成果為基礎繼續開發,一同保存全球的語言,並拉近人們間的距離。
過去最大型的語音資料庫最多僅涵蓋100種語言,因此開發此技術所面臨的第一個挑戰即為「蒐集數千種語言的語音訓練資料」。為了克服這項挑戰,Meta使用已翻譯成多種語言、譯文已被廣泛閱讀及研究的宗教經典,例如「聖經」,作為語言的文字訓練資料。
Meta表示,聖經譯文有多種語言的公開錄音檔,作為大型多語言語音模型計畫的一部分,Meta創造的資料集,蒐集超過1100種語言的「新約聖經」有聲讀物資料集,平均為每種語言提供32小時的語音訓練資料,後續又加入其他未標註的基督教有聲讀物後,可用的語言訓練資料已涵蓋超過4000種語言。
Meta強調,將持續擴增大規模多語言語音模型的涵蓋範圍,以支援更多語言的轉換及辨識,並努力克服現有語音技術難以處理方言的挑戰。
(中央社)
國會助理費修法三讀通過!平均每位助理加5千 下屆起適用
萬海法說報喜!美國線最樂觀、合約價續漲 總座喊:今年一定比去年好
記憶體一起噴!「這2檔」獲三大法人加碼10.4萬張 豪砸近70億元大買南亞科
面板族群又成提款機!外資出清雙雄近20萬張 「這檔」直接被提款33.7億元
矽光子狂飆!法人喊「這檔」目標價上看1080元 單季獲利暴增22倍、Q1淡季不淡
SpaceX傳7月啟動IPO!外資狂砸12億卡位「這檔」2.4萬張 低軌衛星火力全開
擬配現金股利20元!這「ASIC指標廠」2025年獲利大爆發 每股賺進28.13元
老柯壓不住!助理費修法柯建銘已簽協商結論 鍾佳濱陳培瑜反對成發言車輪戰
法說後分歧!投信狠狠砍聯電逾2.6萬張結帳16億元 外資卻喊目標價直上100元
IC設計一片綠中「這檔」飆連3漲停 輝達、美光訪台激勵2檔DRAM股亮燈
終止連8月虧損!投信砸2億回補「這檔」近萬張 法人看好首季出貨回升
目標價喊話77元!「這檔記憶體」多空交戰爆49.9萬成交量…股價漲半根 「它」卻下殺閃現跌停
86歲陳淑芳女兒曝光!是劉德華鐵粉 她沒來陪吃飯好心碎
外資提款「這檔」ETF破46億元!再出貨多檔高股息ETF 0056遭倒破萬張
徐欣瑩炮轟黨中央誓言參選到底 鄭麗文管不住
有黃仁勳欽點!記憶體全面族群噴出 南亞科亮燈炸397.8億…4檔成交額破320億霸榜
利多出來股價不動?台日聯手抗癌推進!「生技大廠」溶瘤病毒新藥完成日方審查
台南人終於等到「都市縫合」23處立交設施將消除 鐵道局預告兩座新車站將陸續啟用
過年不無聊!BTS、SEVENTEEN實境節目將播出 舒淇《女孩》也看得到
矽光子倒一片!「這檔」半導體設備廠重摔8% 光焱科技卻逆勢勁揚
您已閒置超過五分鐘,請點擊右上角關閉按鈕