發布時間:2024/4/10 17:35
圖文/鏡週刊
聯發科推出生成式AI(人工智慧)服務平台支援各大模型,而在其中的一個由聯發創新基地最新釋出的繁體中文大語言模型「MR BreeXe」,內有450億個參數,在中文知識上明顯超越GPT-3.5。同時,這套大語言模型(LLM)在輝達(NVIDIA)的Taipei -1 GPU超級電腦DGX H100上進行訓練,支援多種雲端、地端的應用服務。
廣告 更多內容請繼續往下閱讀
聯發創新基地負責人許大山表示,MediaTek Research BreeXe(後簡稱MR BreeXe)繁體中文大型語言模型是聯發創新基地在大模型發展上最新的里程碑,提供優異語文理解能力和雲、地兩端的彈性,為現今繁體中文能力最強的語言模型,加上與聯發科生成式AI服務平台的搭配,相信能更貼近在地需求,激發更多在地的生成式AI應用。
為了有效因應企業用戶的使用需求,許大山指出,MR BreeXe模型在使用時,能支援四萬字的文本處理,同時,該模型是以Mixtral 8x7B模型為基礎開發,繼承Mixtral多專家模型特有的節省運算資源、提升速度優勢,再加上聯發創新基地的預訓練(pre-training)之後,不但在繁體中文測試項目(TMMLU+、MT Bench TW)超越GPT-3.5,並對台灣常見之地端應用特別進行優化,提升產業界使用生成式AI 與檢索增強生成(RAG)的體驗。
廣告 更多內容請繼續往下閱讀
「2個月前,聯發基地開放給部分合作夥伴試用MR BreeXe模型的訓練資料,效果很令人驚豔,不會有卡頓問題,可以用在即時(Real-time)應用之中。」許大山說道。
說起聯發科投入生成式AI,也不過快2年時間。許大山坦言,當時甚麼都不會,但「不會做、更要做」,特別是大語言模型的技術,是生成式AI的基礎。歷經不斷的摸索,才打造出2款為繁中打造的大語言模型。
許大山接著表示,有些客戶在還沒有這套模型之前,往往不能提供語言、知識相關服務,甚至無法支援一些全封閉環境(如公司內部、部門內部)使用,即便要用,可能要自己下載模型DIY做得頭破血流。而MR BreeXe這套有450億參數的模型,表現即可能幫助企業解決這些現況。
值得一提的是,聯發創新基地資深技術經理陳宜昌強調,MR BreeXe針對中文特殊情境優化,加入中文常用詞彙,速度可以提升1倍,布建成本還能下降一半。
MR BreeXe是在輝達(NVIDIA)的Taipei -1 GPU超級電腦DGX H100上進行訓練,透過MediaTek Davinci,支援全地端與部分地端的佈設場景,並可依需求進行多樣本學習(few-shot learning)甚至微調(fine-tuning)的客製化。
許大山指出,目前聯發科開源模型下載已經達8千多次,功能受到各界肯定,未來將持續更新模型,朝繁中GPT4邁進,期望技術力能跟世界最強的生成式AI一樣強。
更多鏡週刊報導搭高鐵「新竹台北通勤」不可行? 過來人曝通勤10年甘苦:早習慣了
目標價上看300元!這「軸承大廠」傳搶進蘋果摺疊機供應鏈 外資接連看好
男星「甲狀腺癌復發」發病2次!消失3年近況曝光
台灣缺工人不夠?4143人擠破頭報考「這職缺」 層層考試只錄取最後12%
想貸千萬房貸!他年薪不到百萬...買高雄預售屋「靠爸當保人」 網喊:這壓力不小耶
站上鳥巢女歌手第4人!孫燕姿北京開唱飄仙氣 絕美模樣曝光
國安簡報前賴清德會曹興誠玩兩面手法?朱立倫:希望總統言行如一
電競、PC需求強勁!Acer前5月累計營收991億元「年增1.4%」 自營商連11日買超逾7千張
《史迪奇》票房大爆發!授權商「這檔」5月營收破8千萬元 周邊瘋搶…6月業績再飆高
五月天22年前辦簽唱會台下僅10 人!雪恥開唱遭嗆「靠北」 阿信當場反擊
星宇航空拚明年發股利! 張國煒親曝「新機採購計畫」
邀請藍白聽取國安簡報前夕 賴清德先見罷免團體曹興誠「溝通最新規畫」
出師不利?蔣萬安深藍選區首場掃街合體賴士葆 遭嗆大罷免大成功
大學畢業還跟父母住?她遭同事嘲諷「獨立中的小公主」 嘆:00後到底惹誰了
中職/不可能缺席!悍將洋投布坎南中職首秀 狂粉南珉貞曬合照:他兒子還記得我
在手訂單373億不夠看?這「重電大廠」EPS慘下修至8.44元...目標價190元 5月營收23億「年增12%」
以伊衝突引爆避險潮!「油金齊噴」台股卻重挫逾200點 只有「這6軍工概念股」逆勢飆高
台積電重返千元!這「半導體ETF」含積量高達31%超吸睛 投資人搶卡位
吳怡霈遭前經紀人背叛…突嘆「不懂感謝難成大局」 曝真實心聲:人善被犬欺的世界
影/《綜藝大熱門》宣告重啟再出發! 吳宗憲開嗆館長上海行「劉姥姥進大觀園」