發布時間:2024/4/10 17:35
圖文/鏡週刊
聯發科推出生成式AI(人工智慧)服務平台支援各大模型,而在其中的一個由聯發創新基地最新釋出的繁體中文大語言模型「MR BreeXe」,內有450億個參數,在中文知識上明顯超越GPT-3.5。同時,這套大語言模型(LLM)在輝達(NVIDIA)的Taipei -1 GPU超級電腦DGX H100上進行訓練,支援多種雲端、地端的應用服務。
廣告 更多內容請繼續往下閱讀
聯發創新基地負責人許大山表示,MediaTek Research BreeXe(後簡稱MR BreeXe)繁體中文大型語言模型是聯發創新基地在大模型發展上最新的里程碑,提供優異語文理解能力和雲、地兩端的彈性,為現今繁體中文能力最強的語言模型,加上與聯發科生成式AI服務平台的搭配,相信能更貼近在地需求,激發更多在地的生成式AI應用。
為了有效因應企業用戶的使用需求,許大山指出,MR BreeXe模型在使用時,能支援四萬字的文本處理,同時,該模型是以Mixtral 8x7B模型為基礎開發,繼承Mixtral多專家模型特有的節省運算資源、提升速度優勢,再加上聯發創新基地的預訓練(pre-training)之後,不但在繁體中文測試項目(TMMLU+、MT Bench TW)超越GPT-3.5,並對台灣常見之地端應用特別進行優化,提升產業界使用生成式AI 與檢索增強生成(RAG)的體驗。
廣告 更多內容請繼續往下閱讀
「2個月前,聯發基地開放給部分合作夥伴試用MR BreeXe模型的訓練資料,效果很令人驚豔,不會有卡頓問題,可以用在即時(Real-time)應用之中。」許大山說道。
說起聯發科投入生成式AI,也不過快2年時間。許大山坦言,當時甚麼都不會,但「不會做、更要做」,特別是大語言模型的技術,是生成式AI的基礎。歷經不斷的摸索,才打造出2款為繁中打造的大語言模型。
許大山接著表示,有些客戶在還沒有這套模型之前,往往不能提供語言、知識相關服務,甚至無法支援一些全封閉環境(如公司內部、部門內部)使用,即便要用,可能要自己下載模型DIY做得頭破血流。而MR BreeXe這套有450億參數的模型,表現即可能幫助企業解決這些現況。
值得一提的是,聯發創新基地資深技術經理陳宜昌強調,MR BreeXe針對中文特殊情境優化,加入中文常用詞彙,速度可以提升1倍,布建成本還能下降一半。
MR BreeXe是在輝達(NVIDIA)的Taipei -1 GPU超級電腦DGX H100上進行訓練,透過MediaTek Davinci,支援全地端與部分地端的佈設場景,並可依需求進行多樣本學習(few-shot learning)甚至微調(fine-tuning)的客製化。
許大山指出,目前聯發科開源模型下載已經達8千多次,功能受到各界肯定,未來將持續更新模型,朝繁中GPT4邁進,期望技術力能跟世界最強的生成式AI一樣強。
更多鏡週刊報導躺平保台? 國民黨最新「和平才躺平」Reel影片引熱議
股價1年猛飆410%!「電源供應霸主」複製台積電模式 分析師點名「下一檔接棒股」
目標價躍上4字頭!這「台積電材料夥伴」在手工程訂單破百億 連29年高配息超大方
大崩盤前兆?「沃爾瑪指標」飆金融海嘯新高 專家:衰退壓力正在升高
目標價喊出437元!「砷化鎵大廠」手握光通訊、低軌衛星雙題材 今年EPS估達5.66元
通吃AI、低軌衛星市場!「銅箔基板大廠」3月營收飆33.69億元 Q1年增20%雙雙登頂
快訊/「把那該死的海峽打開!」川普怒嗆伊朗:週二等著活在地獄裡吧
協尋失蹤47天山友!跑山獸鎖酬勞挨轟「賞金獵人」 本人親自回應了
外資重押CPO!單週逆勢掃貨「它」22.3萬張居冠 輸血37.1億元
2026恐迎史上最大崩盤?《富爸爸》羅伯特清崎示警:1974兩大制度後遺症引爆全球
記憶體賣壓重災區!投信連砍不手軟 「2大指標股」雙雙被提款27.6、6.86億元
00673R追加募集過關!新份額最快4月8日進場 高溢價風險仍要留意
資金急尋避風港?投信無懼重挫狂撒249億護盤 買超 Top 10「這族群」霸佔半壁江山
AI電源需求爆發!「電源龍頭」目標價上看1890元 今年EPS衝46.1元
花旗上調目標價至2800元!外資單週出脫台積電704億 鴻海、「面板雙虎這檔」全成刀下魂
雙引擎點火!「這記憶體廠」3月營收年增112%、Q1同步創高 小摩目標價直衝9字頭
快訊/新莊電鍍工廠火警!內有存大量「化骨水」黑煙沖天 消防局急呼:快關窗戴口罩
蘋果高價掃貨行動DRAM!外媒爆封鎖供應鏈 聯發科、高通傳受波及
華通、昇達科、長榮在內!台股4月攻略全曝光 16檔抗震名單出爐
20億日圓遺產變負擔?中山美穗獨子放棄繼承 揭開日本遺產稅「變相雙重課稅」爭議
您已閒置超過五分鐘,請點擊右上角關閉按鈕