發布時間:2025/1/29 16:30
記者洪宗荃/綜合報導
中國國產AI大型語言模型DeepSeek(深度求索)話題持續延燒,不過除了國際矚目之外,國內競爭對手也不甘於後,中國網際網路服務巨頭阿里巴巴,近期也透過旗下的阿里雲,發表了自家的AI語言模型通義千問Qwen 2.5-Max超大規模MoE模型,甚至號稱測試表現上優於DeepSeek V3,而阿里巴巴(BABA:NYSE)的美股股價更是收漲6.71%。
根據了解,該研發團隊指出通義千問Qwen 2.5-Max超大規模MoE模型,使用超過20兆token的預訓練數據,及精心設計的後訓練方案進行訓練,並聲稱可以通過API的方式進行訪問,也可以登錄Qwen Chat進行體驗,例如直接與模型對話,或者使用 artifacts及搜索等功能。
廣告 更多內容請繼續往下閱讀
阿里雲跟其他指令模型,包括DeepSeek V3、GPT-4o和Claude-3.5-Sonnet對比性能,在Arena-Hard、LiveBench、LiveCodeBench 和GPQA-Diamond 等基準測試中,Qwen2.5-Max 的表現超越了DeepSeek V3,同時在MMLU-Pro 等其他評估中也展現出了極具競爭力的成績。
在基座模型的對比中,由於無法訪問 GPT-4o 和 Claude-3.5-Sonnet 等閉源模型的基座模型,阿里雲將 Qwen2.5-Max 與目前領先的開源 MoE 模型 DeepSeek V3、最大的開源稠密模型 Llama-3.1-405B,以及同樣位列開源稠密模型前列的 Qwen2.5-72B 進行了對比。
廣告 更多內容請繼續往下閱讀
根據阿里雲研發團隊表示,Qwen2.5-Max的基座模型在大多數基準測試中都展現出了顯著的優勢。研發團隊也強調,隨著後訓練技術的不斷進步,下一個版本的Qwen2.5-Max將會達到更高的水平。
◎《FTNN新聞網》提醒您:本資料僅供參考,投資人應獨立判斷,審慎評估並自負投資風險。
獨家/自提4000億軍購預算惹美不滿?傳美戰爭部次長助理秘訪民眾黨施壓
目標價直衝2210元!不只昇達科「這PCB大廠」有望狂奔 「低軌衛星+AI」雙引擎啟動
影評/《只是一場意外》 你是那個壞人嗎?
靚時尚/從此人生圓滿
想和全世界分享!9歲童海灘發現「45億年前隕石」 專家鑑定:可能來自消失行星
一屍兩命!日孕婦跨年夜慘死家門 警驚見絨毛玩偶藏GPS監控
有片/小米店員示範防摔手機秒破功 網見螢幕脆裂嘲諷:年度最真實測
獨家/孫可芳遇控制狂情人 凡事報備打卡超扯
轉攻機器人!馬斯克宣布停產Model S、X 供應鏈洗牌「潔淨能源ETF」受惠
今最後上車日!外資連4買「巨嬰」2.4萬張 再砸5.2億搶3檔高息ETF…這檔狂掃30日
陳菊為何此時請辭?
鋼鐵人復活火力全開!資金大挪移不愛電子了?「這3檔」鋼鐵族群強勢接棒成盤面新主流
國艦國造好消息!「海鯤艦」完成首次潛航測試 台船股價先漲2.68%
不只能減肥!權威期刊:CBL-514對罕病療效具臨床價值 生技大廠今股價持平
記憶體大逃殺!自營商拋售「這2檔」破萬張 聯電、鴻海也難逃賣壓
低軌衛星+AI基建續加持!國家隊大砍「網通巨擘」捲走3億 反手倒貨旺宏5千張提款4.7億元
財神還沒到!威力彩連27槓 下周一頭獎上看8.7億元
開始割韭菜了?「這檔」拉完4根漲停就直墜…5天崩23.96%慘淪弱勢股王 網哀:趕快高割離席
黃仁勳大直拜會張忠謀!晚宴赴「榕居」用餐 張忠謀坐輪椅出席
台股衝3萬點!金管會研議延長交易
您已閒置超過五分鐘,請點擊右上角關閉按鈕