發布時間:2025/1/29 16:30
記者洪宗荃/綜合報導
中國國產AI大型語言模型DeepSeek(深度求索)話題持續延燒,不過除了國際矚目之外,國內競爭對手也不甘於後,中國網際網路服務巨頭阿里巴巴,近期也透過旗下的阿里雲,發表了自家的AI語言模型通義千問Qwen 2.5-Max超大規模MoE模型,甚至號稱測試表現上優於DeepSeek V3,而阿里巴巴(BABA:NYSE)的美股股價更是收漲6.71%。
根據了解,該研發團隊指出通義千問Qwen 2.5-Max超大規模MoE模型,使用超過20兆token的預訓練數據,及精心設計的後訓練方案進行訓練,並聲稱可以通過API的方式進行訪問,也可以登錄Qwen Chat進行體驗,例如直接與模型對話,或者使用 artifacts及搜索等功能。
廣告 更多內容請繼續往下閱讀
阿里雲跟其他指令模型,包括DeepSeek V3、GPT-4o和Claude-3.5-Sonnet對比性能,在Arena-Hard、LiveBench、LiveCodeBench 和GPQA-Diamond 等基準測試中,Qwen2.5-Max 的表現超越了DeepSeek V3,同時在MMLU-Pro 等其他評估中也展現出了極具競爭力的成績。
在基座模型的對比中,由於無法訪問 GPT-4o 和 Claude-3.5-Sonnet 等閉源模型的基座模型,阿里雲將 Qwen2.5-Max 與目前領先的開源 MoE 模型 DeepSeek V3、最大的開源稠密模型 Llama-3.1-405B,以及同樣位列開源稠密模型前列的 Qwen2.5-72B 進行了對比。
廣告 更多內容請繼續往下閱讀
根據阿里雲研發團隊表示,Qwen2.5-Max的基座模型在大多數基準測試中都展現出了顯著的優勢。研發團隊也強調,隨著後訓練技術的不斷進步,下一個版本的Qwen2.5-Max將會達到更高的水平。
◎《FTNN新聞網》提醒您:本資料僅供參考,投資人應獨立判斷,審慎評估並自負投資風險。
王子律師聲明曝光!揭協商過程 賠償金額未達成共識
謝侑芯經紀人追問「空白18小時」! 提4大疑點:現場有誰、畫面在哪
快訊/王子二度發聲!向范姜彥豐道歉 承諾不會逃避
第三季EPS年增50%!自營商砸8億回頭抱緊「這檔」 續寵南亞科上千張
特斯拉大股東不挺!馬斯克1兆美元薪酬案11/6表決 挪威主權基金表態反對
卸任中選會主委不到1天!李進勇申請恢復民進黨籍 許宇甄轟:假中立真效忠
慘淪空軍ATM?「這2檔題材股」遭連斬9日雙登弱勢股王…「這幾檔」也要小心 網:繼續空不會輸
捲謝侑芯命案!黃明志遲未到案遭通緝 經紀人急喊「太弔詭」:聯繫不上藝人
三大法人開坑散戶?外資、自營商狠砍「這檔」僅投信小挺 「它」也慘被殺到跌停
太子集團涉詐遭扣45億!豪宅車庫26輛名車曝光 驚見超跑4大神獸
三大法人瘋狂掃貨旺宏!「這晶圓大廠」外資逆勢連買13日 台股短線波動資金一樣愛
甲骨文奪10億美元AI超級電腦大單 「這檔供應鏈」卻慘遭外資大砍4.1萬張
點到假網站錢包危險了!4個「普發一萬元」詐騙頁被抓出 登記領錢前先認清這個真網址!
快訊/美國「最有權力副總統」錢尼驚傳逝世 享壽84歲
4G吃到飽恐被聯合下架? 王鴻薇喊話NCC出手:注意是否有不合理壟斷
逾1成股權被吃!中工控遭禿鷹式掠奪 寶佳證實動員15自然人+法人展開併購
民眾黨挺藍營「停砍年改」 民進黨怒轟黃國昌:向過去堅持改革的自己抱歉
大哥又追高殺低?投信買超28.95億卻狠砍「這檔題材股」…記憶體「它」也被殺半根 網:連滾帶爬
愛沙尼亞設處卡關?傳台灣、台北名稱談不攏 林佳龍回應了
EPS高達21.67!這電子大廠「霸氣賺兩股本」聲勢狂飆 PCB族群同步起漲、AI概念股全線沸騰
您已閒置超過五分鐘,請點擊右上角關閉按鈕