發布時間:2023/5/23 15:07
臉書(Meta)今天公布,旗下大規模多語言語音模型,可辨識超過4000種口語表達的語言,辨識量是既有技術的40倍;文字語音互轉技術的應用範圍,從100種語言增加至1100種,且可用於AR及VR。
世界上許多語言正面臨消失的危機,而現有的語言辨識與生成技術上的限制更加快此趨勢。Meta今天發布新聞稿指出,Meta發表一系列的AI模型,希望幫助用戶以自己習慣的語言,更輕鬆獲取資訊及使用電子裝置。
廣告 更多內容請繼續往下閱讀
Meta表示,公司研發的大規模多語言語音(Massively Multilingual Speech,簡稱MMS)模型,擴展文字轉語音及語音轉文字技術的應用範圍,從最初的100種語言,至今已可轉換超過1100種語言,超越過去的10倍。還能辨識超過4000種口語語言,是過去的40倍。
應用案例方面,從VR(虛擬實境)、AR(擴增實境)至訊息服務,不僅能使用偏好語言操作,更可理解每個人的聲音。
廣告 更多內容請繼續往下閱讀
Meta指出,將開源這項技術的原始碼及模型,讓研究社群能夠以現有的工作成果為基礎繼續開發,一同保存全球的語言,並拉近人們間的距離。
過去最大型的語音資料庫最多僅涵蓋100種語言,因此開發此技術所面臨的第一個挑戰即為「蒐集數千種語言的語音訓練資料」。為了克服這項挑戰,Meta使用已翻譯成多種語言、譯文已被廣泛閱讀及研究的宗教經典,例如「聖經」,作為語言的文字訓練資料。
Meta表示,聖經譯文有多種語言的公開錄音檔,作為大型多語言語音模型計畫的一部分,Meta創造的資料集,蒐集超過1100種語言的「新約聖經」有聲讀物資料集,平均為每種語言提供32小時的語音訓練資料,後續又加入其他未標註的基督教有聲讀物後,可用的語言訓練資料已涵蓋超過4000種語言。
Meta強調,將持續擴增大規模多語言語音模型的涵蓋範圍,以支援更多語言的轉換及辨識,並努力克服現有語音技術難以處理方言的挑戰。
(中央社)
川普關稅恐衝擊全球經濟!美股四大指數大跳水...道瓊狂跌549.07點 台積電ADR重挫2.72%
台灣吞20%關稅!三大法人2天砸72億狂買鴻海 「這2檔」沒在怕逆勢上漲
龐大代價換取關稅15%!日韓砸千億美元投資 網炸鍋:美國已經統治地球
才剛終結兩季虧損!這檔卻暴跌9日淪弱勢股王 股民怨:廢材扶不起
GB300要來了!投信卻翻臉砍「這檔」輝達供應鏈 倒貨近2000張提款2.4億元
普發一萬過關了!總統賴清德公告特別條例 依法「這時間」前發放完畢
232條款才是大魔王! 投信重砸3.2億搶買鴻海 連6日橫掃這3檔
慘被小兒看衰?三大法人瘋砍營收保守「這2檔」…外資、投信都殺瘋了 網:離鴻海越來越遠
20%關稅怎麼辦?卓榮泰對策「一週內籌編強化韌性特別預算」
Q2財報近5季新低!這「封測龍頭廠」遭外資提款32億 台新辛特被丟第7日成賣超王
外資嗅到商機了?賣超70.65億卻瞄準「連噴47%這檔」瘋搶萬張…狂砸鴻海18.9億 網:大家抱緊
20%關稅也擋不住!機殼股全面衝刺 晟銘電漲破5%領概念股起飛
職籃合併破局!TPBL宣布自行舉辦新人選秀會 攻城獅取得狀元籤
職排台日大戰!東京巨熊球星喊話與陳建禎對決 TPVL熱身賽9月開打
蔡依林「突消失20分鐘」!同事沒人能找到 天后親揭真相
連8日噴49%!「這電腦大廠」營收由虧轉盈…股價創11年新高 成交量爆4.9萬張
民眾黨中評會開罰!嗆黃光芹瘋狗的她被停權3個月 涉詐欺中央委員遭停權一年半
影/〈年輪〉原唱之爭! 「汪蘇瀧回應與韓紅合唱」登上熱搜
台灣關稅列高檔15國之一 賴清德記者會被嫌棄「3不1沒有」 羅友志:沒重點、聽不懂!
乘著關稅大浪前行!機器人股過半收紅盤 東元、致茂拔漲停領軍12檔勁揚