發布時間:2025/1/29 16:30
記者洪宗荃/綜合報導
中國國產AI大型語言模型DeepSeek(深度求索)話題持續延燒,不過除了國際矚目之外,國內競爭對手也不甘於後,中國網際網路服務巨頭阿里巴巴,近期也透過旗下的阿里雲,發表了自家的AI語言模型通義千問Qwen 2.5-Max超大規模MoE模型,甚至號稱測試表現上優於DeepSeek V3,而阿里巴巴(BABA:NYSE)的美股股價更是收漲6.71%。
根據了解,該研發團隊指出通義千問Qwen 2.5-Max超大規模MoE模型,使用超過20兆token的預訓練數據,及精心設計的後訓練方案進行訓練,並聲稱可以通過API的方式進行訪問,也可以登錄Qwen Chat進行體驗,例如直接與模型對話,或者使用 artifacts及搜索等功能。
廣告 更多內容請繼續往下閱讀
阿里雲跟其他指令模型,包括DeepSeek V3、GPT-4o和Claude-3.5-Sonnet對比性能,在Arena-Hard、LiveBench、LiveCodeBench 和GPQA-Diamond 等基準測試中,Qwen2.5-Max 的表現超越了DeepSeek V3,同時在MMLU-Pro 等其他評估中也展現出了極具競爭力的成績。
在基座模型的對比中,由於無法訪問 GPT-4o 和 Claude-3.5-Sonnet 等閉源模型的基座模型,阿里雲將 Qwen2.5-Max 與目前領先的開源 MoE 模型 DeepSeek V3、最大的開源稠密模型 Llama-3.1-405B,以及同樣位列開源稠密模型前列的 Qwen2.5-72B 進行了對比。
廣告 更多內容請繼續往下閱讀
根據阿里雲研發團隊表示,Qwen2.5-Max的基座模型在大多數基準測試中都展現出了顯著的優勢。研發團隊也強調,隨著後訓練技術的不斷進步,下一個版本的Qwen2.5-Max將會達到更高的水平。
◎《FTNN新聞網》提醒您:本資料僅供參考,投資人應獨立判斷,審慎評估並自負投資風險。
黃大煒驚傳驟逝!康康痛失19年摯友難接受 沉重回應:讓我平復一下
白宮變身格鬥場!川普豪砸19億辦80歲狂歡壽宴 學者痛批「古羅馬的麵包與馬戲」
影/王陽明大秀「超狂琴技」!?網笑:彈的很好但下次別彈了XD
影/全世界 FEARNOT 都看錯!前 TPE48 李采潔「激似金采源」 一比一神複製挑戰〈BOOMPALA〉掀熱議
藍綠都喊廢監院卻不做 張景森轟「說一套、做一套」:台灣政治最可恥的地方
黃大煒驟世!影集〈我們的藍調時光〉成遺作 柴智屏心痛發聲
圓山保齡球館再見!台北人一甲子回憶驚傳熄燈 網淚喊:再見青春
首季EPS衝1.8元!「這玻纖布」亮燈漲停炸5.3萬張 轉投資記憶體+切銅箔基板後市看旺
鳳小岳曝夫妻不吵架秘訣!老婆不爽默默做1事求和 驚曝跨年直播險脫褲子
看中南樹林華廈!28歲白領憂「未來賣不掉賠錢」 網給建議:可考慮土城、頂埔
S2O Taiwan首日萬人濕身狂歡!鼓鼓甜蜜放閃大元 「看到她就像看到全世界」
「綠能廠」再傳弊案!涉收賄逾5千萬 3高管遭押禁見
黃大煒驟逝!噩耗公開前女友Vicky突曬舊照惹鼻酸 杜詩梅:永遠記得哥的美好
AI狂潮燒不停!台玻砸逾20億再擴產 高階玻纖布供不應求、訂單能見度一路亮
黃大煒驚傳離世享壽61歲!曾伴女友抗癌20多年 粉專最後發文引鼻酸
台股下一步怎麼走?台積電成「最便宜AI股」?法人喊話「這條件」可挑戰5萬點
藍白立院放寬緩刑、易刑都可參選 林淑芬罵「臭俗辣」被民眾黨爆自己「也有案想解套」
搖滾教父黃大煒離世!唱紅〈你把我灌醉〉成傳奇 昔稱:沒有音樂,我沒有理由活著
黃大煒驟逝享壽61歲!曾因心臟衰竭急送醫 無慢性病卻爆心肺超載
Q1 EPS達1.7元!「被動元件大廠」連拉2根漲停創高 MLCC、鉭電容缺貨漲價循環加持
您已閒置超過五分鐘,請點擊右上角關閉按鈕