發布時間:2023/5/23 15:07
臉書(Meta)今天公布,旗下大規模多語言語音模型,可辨識超過4000種口語表達的語言,辨識量是既有技術的40倍;文字語音互轉技術的應用範圍,從100種語言增加至1100種,且可用於AR及VR。
世界上許多語言正面臨消失的危機,而現有的語言辨識與生成技術上的限制更加快此趨勢。Meta今天發布新聞稿指出,Meta發表一系列的AI模型,希望幫助用戶以自己習慣的語言,更輕鬆獲取資訊及使用電子裝置。
廣告 更多內容請繼續往下閱讀
Meta表示,公司研發的大規模多語言語音(Massively Multilingual Speech,簡稱MMS)模型,擴展文字轉語音及語音轉文字技術的應用範圍,從最初的100種語言,至今已可轉換超過1100種語言,超越過去的10倍。還能辨識超過4000種口語語言,是過去的40倍。
應用案例方面,從VR(虛擬實境)、AR(擴增實境)至訊息服務,不僅能使用偏好語言操作,更可理解每個人的聲音。
廣告 更多內容請繼續往下閱讀
Meta指出,將開源這項技術的原始碼及模型,讓研究社群能夠以現有的工作成果為基礎繼續開發,一同保存全球的語言,並拉近人們間的距離。
過去最大型的語音資料庫最多僅涵蓋100種語言,因此開發此技術所面臨的第一個挑戰即為「蒐集數千種語言的語音訓練資料」。為了克服這項挑戰,Meta使用已翻譯成多種語言、譯文已被廣泛閱讀及研究的宗教經典,例如「聖經」,作為語言的文字訓練資料。
Meta表示,聖經譯文有多種語言的公開錄音檔,作為大型多語言語音模型計畫的一部分,Meta創造的資料集,蒐集超過1100種語言的「新約聖經」有聲讀物資料集,平均為每種語言提供32小時的語音訓練資料,後續又加入其他未標註的基督教有聲讀物後,可用的語言訓練資料已涵蓋超過4000種語言。
Meta強調,將持續擴增大規模多語言語音模型的涵蓋範圍,以支援更多語言的轉換及辨識,並努力克服現有語音技術難以處理方言的挑戰。
(中央社)
AI全面上攻...美股四大指數大漲!那斯達克飆348點 輝達、台積電ADR皆漲近4%
銀彈上膛瞄準發射!八大公股月撒40億狂掃「它」13萬張 「這5檔ETF」同步吸金破10億
仙人指路或彈盡糧絕?馬斯克喊明年人形機器人增10倍 主力卻大砍「這檔」近萬張...股民:上面冤魂多
股利配發創新高!長老卻狂丟「它」破3萬張 晶圓製造概念股「這檔」也難逃...遭提款11億
專挑老黃概念股下手?自營商4月倒「這2檔」破萬張 鴻海、光寶科也遭殃
中美關稅互不讓步!中國也防美國「洗產地」 出動高科技嚴抓美國黃豆
現金股利5元!這檔「記憶體模組廠」力抗關稅衝擊 散熱技術突破瓶頸...現金殖利率近6%
鞋底抹油趕緊跑!三大法人獵殺「這檔」得手11.6億 單月暴砍「它」13.4萬張
AI熱潮助攻!這檔「PCB大廠」首季獲利創新高 年增75%...目標價上調4.49%
健身館員工遭偷襲受傷還被政治謾罵 報警抓不到人館長拍片痛訴「台灣人講政治要打打殺殺嗎」
與英特爾合作順利!三大法人橫掃聯電破12萬張 輝達概念股「這檔」今年訂單續揚...遭猛砸78億攬入
閃兵外案!王大陸情侶動人脈「查個資」…相關6人遭北檢起訴 四海幫堂主、好友交保
逃亡7年歸案!貴婦奈奈200萬交保 需戴電子腳環、限制出入境
遭廖峻3子女告竊盜!女助理交出「房契、銀行存摺」:緣起緣滅 律師聲明全文曝光
外資砍飛了!1類股本月遭倒破22萬張…回補數十億 「這10檔」也慘兮兮
美國恐要求新台幣升值?央行闢謠:與事實不符
如果又股災怎麼辦?美關稅不定…他問是否該留後路 網推1「進場公式」:誰管最低點
川普鬆口!有望與「印日韓」達貿易協議 親吐談判破局下場
外資4月大買「這檔」破18萬張!中華電股災中秀抗跌 也獲破4萬張進貨
溫哥華汽車衝撞釀11死!台女打工度假遭撞飛 「重傷昏迷」駐處全力協助