發布時間:2024/4/10 17:35
圖文/鏡週刊
聯發科推出生成式AI(人工智慧)服務平台支援各大模型,而在其中的一個由聯發創新基地最新釋出的繁體中文大語言模型「MR BreeXe」,內有450億個參數,在中文知識上明顯超越GPT-3.5。同時,這套大語言模型(LLM)在輝達(NVIDIA)的Taipei -1 GPU超級電腦DGX H100上進行訓練,支援多種雲端、地端的應用服務。
廣告 更多內容請繼續往下閱讀
聯發創新基地負責人許大山表示,MediaTek Research BreeXe(後簡稱MR BreeXe)繁體中文大型語言模型是聯發創新基地在大模型發展上最新的里程碑,提供優異語文理解能力和雲、地兩端的彈性,為現今繁體中文能力最強的語言模型,加上與聯發科生成式AI服務平台的搭配,相信能更貼近在地需求,激發更多在地的生成式AI應用。
為了有效因應企業用戶的使用需求,許大山指出,MR BreeXe模型在使用時,能支援四萬字的文本處理,同時,該模型是以Mixtral 8x7B模型為基礎開發,繼承Mixtral多專家模型特有的節省運算資源、提升速度優勢,再加上聯發創新基地的預訓練(pre-training)之後,不但在繁體中文測試項目(TMMLU+、MT Bench TW)超越GPT-3.5,並對台灣常見之地端應用特別進行優化,提升產業界使用生成式AI 與檢索增強生成(RAG)的體驗。
廣告 更多內容請繼續往下閱讀
「2個月前,聯發基地開放給部分合作夥伴試用MR BreeXe模型的訓練資料,效果很令人驚豔,不會有卡頓問題,可以用在即時(Real-time)應用之中。」許大山說道。
說起聯發科投入生成式AI,也不過快2年時間。許大山坦言,當時甚麼都不會,但「不會做、更要做」,特別是大語言模型的技術,是生成式AI的基礎。歷經不斷的摸索,才打造出2款為繁中打造的大語言模型。
許大山接著表示,有些客戶在還沒有這套模型之前,往往不能提供語言、知識相關服務,甚至無法支援一些全封閉環境(如公司內部、部門內部)使用,即便要用,可能要自己下載模型DIY做得頭破血流。而MR BreeXe這套有450億參數的模型,表現即可能幫助企業解決這些現況。
值得一提的是,聯發創新基地資深技術經理陳宜昌強調,MR BreeXe針對中文特殊情境優化,加入中文常用詞彙,速度可以提升1倍,布建成本還能下降一半。
MR BreeXe是在輝達(NVIDIA)的Taipei -1 GPU超級電腦DGX H100上進行訓練,透過MediaTek Davinci,支援全地端與部分地端的佈設場景,並可依需求進行多樣本學習(few-shot learning)甚至微調(fine-tuning)的客製化。
許大山指出,目前聯發科開源模型下載已經達8千多次,功能受到各界肯定,未來將持續更新模型,朝繁中GPT4邁進,期望技術力能跟世界最強的生成式AI一樣強。
更多鏡週刊報導台北煙霧彈、隨機砍人嫌犯起底!本名「張文」、27歲男 妨害兵役通緝犯
快訊/北車恐攻男奔中山站「隨機砍人」釀9傷、4命危 遭警包圍後墜樓...送往馬偕醫院搶救中
57歲英勇男阻煙霧彈惡徒!遭嫌犯預藏利器猛刺背部 大量出血命危急送台大醫院
北車煙霧彈男逃至中山隨機砍人!遭警圍堵墜樓 「失去生命跡象」送馬偕搶救中
男子在北車、中山持長刀隨機砍人 賴清德說重話了:絕不寬貸!
快訊/中山砍人案已知6名傷者 其中兩人OHCA
台北車站、中山商圈爆隨機砍人案 卓榮泰前往視察:會傾全力徹夜辦案
不甩00713大換血!這檔股價「連漲7日」投信砍倉16天 上海商銀穩坐獲利王仍淪賣超苦主
快訊/中山隨機砍人男闖入誠品南西店!多人中刀傷勢不明 兇嫌受包圍後墜樓
北車M7出口遭扔煙霧彈!57歲男疑阻止犯嫌遭捅倒地 臺大醫院:仍在搶救中
北車剛爆煙霧彈攻擊...北捷中山站外1男隨機砍人 持刀闖入誠品南西店
搭上00919換股熱潮!台新新光金股價連漲4天 投信大力加碼狂掃10.7萬張
北車M7出口遭丟煙霧彈!1人無生命徵象送醫、嫌犯在逃中 捷運一度過站不停
辦全台公聽會!藍白控賴清德架空國會 批「袁世凱再現」提彈劾「怪獸總統」、要求赴院說明
快訊/鴻華先進砸7.8億收購納智捷100%股權! 寫下台灣電動車發展新頁
憲法法庭判《憲訴法》修正案違憲 行政院:盼民主憲政制度恢復良善運作
美國布朗大學槍擊案…嫌犯移民背景曝光 川普怒令:暫停「綠卡樂透」
影/謝金燕飛首爾合體KARA前成員Nicole 她甜喊:下次換妳來台北看我囉!
影/8月剛動完大手術! 楊丞琳拍片曝最新病況
憲法法庭癱瘓1年被判違憲 律師諷「藍白應樂見」化解不敢倒閣的政治壓力
您已閒置超過五分鐘,請點擊右上角關閉按鈕