發布時間:2023/5/23 15:07
臉書(Meta)今天公布,旗下大規模多語言語音模型,可辨識超過4000種口語表達的語言,辨識量是既有技術的40倍;文字語音互轉技術的應用範圍,從100種語言增加至1100種,且可用於AR及VR。
 
 世界上許多語言正面臨消失的危機,而現有的語言辨識與生成技術上的限制更加快此趨勢。Meta今天發布新聞稿指出,Meta發表一系列的AI模型,希望幫助用戶以自己習慣的語言,更輕鬆獲取資訊及使用電子裝置。
廣告 更多內容請繼續往下閱讀
Meta表示,公司研發的大規模多語言語音(Massively Multilingual Speech,簡稱MMS)模型,擴展文字轉語音及語音轉文字技術的應用範圍,從最初的100種語言,至今已可轉換超過1100種語言,超越過去的10倍。還能辨識超過4000種口語語言,是過去的40倍。
應用案例方面,從VR(虛擬實境)、AR(擴增實境)至訊息服務,不僅能使用偏好語言操作,更可理解每個人的聲音。
廣告 更多內容請繼續往下閱讀
Meta指出,將開源這項技術的原始碼及模型,讓研究社群能夠以現有的工作成果為基礎繼續開發,一同保存全球的語言,並拉近人們間的距離。
過去最大型的語音資料庫最多僅涵蓋100種語言,因此開發此技術所面臨的第一個挑戰即為「蒐集數千種語言的語音訓練資料」。為了克服這項挑戰,Meta使用已翻譯成多種語言、譯文已被廣泛閱讀及研究的宗教經典,例如「聖經」,作為語言的文字訓練資料。
Meta表示,聖經譯文有多種語言的公開錄音檔,作為大型多語言語音模型計畫的一部分,Meta創造的資料集,蒐集超過1100種語言的「新約聖經」有聲讀物資料集,平均為每種語言提供32小時的語音訓練資料,後續又加入其他未標註的基督教有聲讀物後,可用的語言訓練資料已涵蓋超過4000種語言。
Meta強調,將持續擴增大規模多語言語音模型的涵蓋範圍,以支援更多語言的轉換及辨識,並努力克服現有語音技術難以處理方言的挑戰。
(中央社)
再觸歷史新天價!台積電成交額爆153.8億稱霸 這「封測龍頭廠」Q3財報亮眼猛攻漲停板
吳怡農下午交參選意願書!王世堅連說4次「很好」:要借服務處、戰車都行
輝達GTC大會題材點火!矽光子股強勢勁揚 立碁、穩懋、日月光飆上漲停
不認為普丁是獨裁者!鄭麗文:他是民主選出的領袖
坣娜不是胰臟癌!「真正死因曝光」 富商尪悲痛發聲
一週市值蒸發逾485億!三商壽還沒娶進門「股價跌破三字頭」摔出台股前20強
傳正國會發文被黨中央關切 林岱樺稱尊重:部長是希望公眾人物負責任
AI族群紅光滿面!這「PCB廠」攜手金像電亮燈漲停 台光電等3檔漲破半根
鏡爆2021前後曾多次赴港 黃國昌要求提證據轟虛構:中午前更正道歉否則提告
CNN揭露台灣對川普遊說受挫!宴請美官員無1人出席「嚴重到想另闢管道」
機器人族群出擊!多檔個股漲破半根 士電最高飆破8%
Q2營收138億創高!90億籌資+泰國廠Q4量產雙利多發酵 金像電炸萬張大量攻漲停
記憶體成難兄難弟!旺宏慘吞跌停...爆18萬張登成交王 力積電連漲5日後重摔破3%
王子爆介入粿粿、范姜彥豐婚姻!生日文早埋伏筆 偷藏「愛的合照」
31歲護理女神謝侑芯驚傳猝逝!曾爆被「王姓CEO」追求 好友雪碧心痛發聲
480億併購三商壽被質疑「摸黑交易」?玉山金、三商壽深夜發重訊澄清
再減6千股民!00939月配0.072元維持新高今最後上車日 年化配息率逼6%
王力宏揪Ella飆經典!「版權問題」慘被下架 爆遭獅子大開口
傳鄭麗文探詢明年接棒藍立院黨團總召?林德福:那明年的事還早
AI基礎建設引爆!「重電四雄」齊勁揚領軍概念股 華城衝漲停...亞力、士電飆破半根
您已閒置超過五分鐘,請點擊右上角關閉按鈕
 
  
  
  
  
  
  
  
  
 