發布時間:2024/4/10 17:35
圖文/鏡週刊
聯發科推出生成式AI(人工智慧)服務平台支援各大模型,而在其中的一個由聯發創新基地最新釋出的繁體中文大語言模型「MR BreeXe」,內有450億個參數,在中文知識上明顯超越GPT-3.5。同時,這套大語言模型(LLM)在輝達(NVIDIA)的Taipei -1 GPU超級電腦DGX H100上進行訓練,支援多種雲端、地端的應用服務。
廣告 更多內容請繼續往下閱讀
聯發創新基地負責人許大山表示,MediaTek Research BreeXe(後簡稱MR BreeXe)繁體中文大型語言模型是聯發創新基地在大模型發展上最新的里程碑,提供優異語文理解能力和雲、地兩端的彈性,為現今繁體中文能力最強的語言模型,加上與聯發科生成式AI服務平台的搭配,相信能更貼近在地需求,激發更多在地的生成式AI應用。
為了有效因應企業用戶的使用需求,許大山指出,MR BreeXe模型在使用時,能支援四萬字的文本處理,同時,該模型是以Mixtral 8x7B模型為基礎開發,繼承Mixtral多專家模型特有的節省運算資源、提升速度優勢,再加上聯發創新基地的預訓練(pre-training)之後,不但在繁體中文測試項目(TMMLU+、MT Bench TW)超越GPT-3.5,並對台灣常見之地端應用特別進行優化,提升產業界使用生成式AI 與檢索增強生成(RAG)的體驗。
廣告 更多內容請繼續往下閱讀
「2個月前,聯發基地開放給部分合作夥伴試用MR BreeXe模型的訓練資料,效果很令人驚豔,不會有卡頓問題,可以用在即時(Real-time)應用之中。」許大山說道。
說起聯發科投入生成式AI,也不過快2年時間。許大山坦言,當時甚麼都不會,但「不會做、更要做」,特別是大語言模型的技術,是生成式AI的基礎。歷經不斷的摸索,才打造出2款為繁中打造的大語言模型。
許大山接著表示,有些客戶在還沒有這套模型之前,往往不能提供語言、知識相關服務,甚至無法支援一些全封閉環境(如公司內部、部門內部)使用,即便要用,可能要自己下載模型DIY做得頭破血流。而MR BreeXe這套有450億參數的模型,表現即可能幫助企業解決這些現況。
值得一提的是,聯發創新基地資深技術經理陳宜昌強調,MR BreeXe針對中文特殊情境優化,加入中文常用詞彙,速度可以提升1倍,布建成本還能下降一半。
MR BreeXe是在輝達(NVIDIA)的Taipei -1 GPU超級電腦DGX H100上進行訓練,透過MediaTek Davinci,支援全地端與部分地端的佈設場景,並可依需求進行多樣本學習(few-shot learning)甚至微調(fine-tuning)的客製化。
許大山指出,目前聯發科開源模型下載已經達8千多次,功能受到各界肯定,未來將持續更新模型,朝繁中GPT4邁進,期望技術力能跟世界最強的生成式AI一樣強。
更多鏡週刊報導尾盤都有逃命波?主力倒貨最多不是鴻海而是「這檔」 股民:186很吉利...大家不要我來接刀
阿北是你嗎?生達盃桌球賽驚現「乒乓柯P」成全場焦點 真實身分曝
長老也要逃跑?八大公股週砍台塑四寶不留情 狙擊貨櫃三雄的「它」提領7.6億
陽明11月營收年月雙增!又獲3檔千億級ETF青睞 上週獲三大法人買破4萬張
捲入沒禮貌霸佔前輩高鐵座位 林襄發文稱:我需要一些巴多胺
文化部預算審查前 柯志恩提「十大靈魂拷問」質疑部長小野「忘卻媒改理想與道德勇氣」
周一最後上車日!00713「配息1.4元」季增4.5萬股民 一圖看11檔ETF這天除息
陸移民女陳屍澳洲公園!台籍夫仍生死未卜 外交部回應了
台塑四寶股價腰斬!「這檔」比南亞更慘淪為弱勢股王 6天股價跌幅逾20%
搶命!八大公股撒18億救援鴻海 外資爆砍聯電15週...長老買8千張難止血
曾開車衝撞館長健身房!「賓士男」驚傳死訊 家屬發聲證實了
00929退燒了!八大公股狂丟3萬張...提款5.5億 外資瘋買整週的「它」也被砍逾4千張
救救公公!鴻海11月營收月減股價連7跌 上週再遭三大法人倒破10萬張
最便宜AI股1年漲185%!主力進場瘋買3.1萬張 股民嗨:蓋牌兩位數見
全台2個月被騙走246億!這縣市月增164.6% 網見「1網站」嚇瘋:陳梅慧的死不是沒理由
4萬人跳車...00929股民下探88萬人 外資單週小買1.7萬張開始脫手了!
韓東勳傳將請辭南韓執政黨黨魁 消息洩漏後記者會改至16日舉行
問題影射「當過市長」選新北勝算高於蘇巧慧?林右昌:我想你講的當然是事實
又來了!羅大佑激唱一半被觀眾喊「台灣是中國的」 陸網友不挺反酸:活該被扔出去
大甲鎮瀾宮建醮大典!「百萬烏魚子龍」直接被拔光 廟方大氣回:活動圓滿就好