發布時間:2023/5/23 15:07
臉書(Meta)今天公布,旗下大規模多語言語音模型,可辨識超過4000種口語表達的語言,辨識量是既有技術的40倍;文字語音互轉技術的應用範圍,從100種語言增加至1100種,且可用於AR及VR。
世界上許多語言正面臨消失的危機,而現有的語言辨識與生成技術上的限制更加快此趨勢。Meta今天發布新聞稿指出,Meta發表一系列的AI模型,希望幫助用戶以自己習慣的語言,更輕鬆獲取資訊及使用電子裝置。
廣告 更多內容請繼續往下閱讀
Meta表示,公司研發的大規模多語言語音(Massively Multilingual Speech,簡稱MMS)模型,擴展文字轉語音及語音轉文字技術的應用範圍,從最初的100種語言,至今已可轉換超過1100種語言,超越過去的10倍。還能辨識超過4000種口語語言,是過去的40倍。
應用案例方面,從VR(虛擬實境)、AR(擴增實境)至訊息服務,不僅能使用偏好語言操作,更可理解每個人的聲音。
廣告 更多內容請繼續往下閱讀
Meta指出,將開源這項技術的原始碼及模型,讓研究社群能夠以現有的工作成果為基礎繼續開發,一同保存全球的語言,並拉近人們間的距離。
過去最大型的語音資料庫最多僅涵蓋100種語言,因此開發此技術所面臨的第一個挑戰即為「蒐集數千種語言的語音訓練資料」。為了克服這項挑戰,Meta使用已翻譯成多種語言、譯文已被廣泛閱讀及研究的宗教經典,例如「聖經」,作為語言的文字訓練資料。
Meta表示,聖經譯文有多種語言的公開錄音檔,作為大型多語言語音模型計畫的一部分,Meta創造的資料集,蒐集超過1100種語言的「新約聖經」有聲讀物資料集,平均為每種語言提供32小時的語音訓練資料,後續又加入其他未標註的基督教有聲讀物後,可用的語言訓練資料已涵蓋超過4000種語言。
Meta強調,將持續擴增大規模多語言語音模型的涵蓋範圍,以支援更多語言的轉換及辨識,並努力克服現有語音技術難以處理方言的挑戰。
(中央社)
這妖股遭摜殺!4天狠跌24%竟爆違約交割 逆勢狂喊:目標價翻倍上看400元
雨刷洗錢兩百億2/名牌包堆整牆、用愛馬仕洗香香 雨刷夫妻奢豪生活曝光
雨刷洗錢兩百億/搞臭中職出獄更大尾 揭雨刷夫妻掌東南亞最大洗錢水房
柯文哲維持7000萬交保 柯媽哽咽「我的孩子真是好孩子」
興達燒出未爆彈2/副廠廉價劣質「法蘭」改標洗產地 檢嚴查中油標案內神通外鬼
又2.3萬股民下車!00929月配0.08元今最後買進日 這檔ETF年化配息率飆8%
興達燒出未爆彈/興達電廠關鍵連接零件釀巨災 揭台電、中油潛藏國安危機
美中達成TikTok框架協議 川普19日將與習近平敲定
小鬼離世5週年KID貼文灑洋蔥 網:鬼哥在外太空是好好的
閨密情鬧翻/獨家!慶生未獲邀請 炎亞綸二度取消關注鬼鬼
綠整隊拚止血/823後整補破網 賴領導風格難安基層焦慮
最後上車日不要了!八大公股狠倒00919出逃 這檔挨刀1.8億止步連7漲
觀察/賴神守得住台南高雄嗎?2026綠地變藍天?
AI投資恐血本無歸?OpenAI董事長憂AI估值過熱 示警泡沫化徵兆浮現
目標價翻倍調漲至280元!「載板大廠」受惠PCB缺貨潮延燒 搶吃漲價紅利
記憶體再吹漲價號角!自營商砸1.8億打包3檔入袋 它獲掃上千張「連寵36日」
「這檔」記憶體股飆漲停!卻被八大公股提款破7億元 再倒上千張中信金
蕭敬騰加盟新東家!宣告「一切是最好的安排」 愛妻Summer說話了
白冰冰愛徒現蹤台南!合體本土男星 為國寶歌后文香慶生
柯文哲維持交保!黃國昌稱打臉北檢 綠委:司法不會一下死一下活