FTNN 新聞網
新聞大追查
  • FTNN 新聞網 Facebook 粉絲專頁
  • FTNN 新聞網 Youtube 頻道
【週日21~週一12】
鄉民監察院_每周二三
政治讀新術_每周一四

教育部台語語料庫上線 可供課程設計和AI應用

發布時間:2024/8/26 15:02

為了全力支持本土語言研究,教育部於2023年委託國家教育研究院建置及維護臺灣台語語音語料庫相關計畫,現已公布供各界運用。(翻攝臺灣台語語音語料庫網站)

圖文/鏡週刊

教育部委託國家教育研究院建置「臺灣台語語料庫應用檢索系統」已公布供各界運用,系統查檢的資訊可供國民中小學課程設計、教學與評量需求外,供下載的語料庫也可作為語音處理或輔助教學的AI開發基礎。

廣告 更多內容請繼續往下閱讀

為了全力支持本土語言研究,教育部於2023年委託國家教育研究院建置及維護臺灣台語語音語料庫相關計畫,將語料庫的成果加以保存、維護,並增錄教育部辭典及盧廣誠先生編《華台對照詞典》的例句,延伸建立「臺灣台語語料庫應用檢索系統」,包含3大子系統,語料檢索系統、教科書詞彙檢索系統、語法點檢索系統。

此外,開放各界申請下載2019年教育部辦理臺灣台語語音語料庫計畫成果,包括語料庫、音檔及AI工具模型等。內容包含2萬6千餘句的文字,每句有4至6位發音人共6種聲音來源的音檔總計208小時,另有語音處理的AI工具模型。

廣告 更多內容請繼續往下閱讀

各項成果適合語言研究者應用在語料及文本分析等相關領域,以及資訊人員用以開發語音辨識、語音合成等相關AI系統,或進一步建置本土語言教學輔助工具。有意申請者請至網站首頁,點擊右上方「語料申請」進入申請頁面,填畢基本資訊按「送出」,可於所填的電子信箱收到申請書檔案,填寫完申請書並簽名後將掃描檔回傳,維護團隊於審核通過後寄送語料庫成果下載連結(七日內有效)予申請人。

教育部為大規模保存臺灣台語語料,精進既有成果,自111年11月起委請國立陽明交通大學辦理新一階段的臺灣台語語料庫建置計畫,預計至115年10月完成,將擴大建置約文字語料2,000萬字及口語語料3,000小時的語料庫,並持續提高語音處理AI工具的實用效能,期望為本土語言研究、教學資源建置以及語言AI系統的開發貢獻更多力量。


更多鏡週刊報導
嘲諷「誰會去光華商場單買一顆CPU」淪笑柄 胡采蘋認黑歷史:沒有人全知全能
YTR介紹台灣掀熱議 韓網吐槽「高GDP卻低薪」靠台積電在撐!台網哭了
李洋回歸校園囉! 國體大迎接「李洋老師」狂賀
top