發布時間:2025/1/29 16:30
記者洪宗荃/綜合報導
中國國產AI大型語言模型DeepSeek(深度求索)話題持續延燒,不過除了國際矚目之外,國內競爭對手也不甘於後,中國網際網路服務巨頭阿里巴巴,近期也透過旗下的阿里雲,發表了自家的AI語言模型通義千問Qwen 2.5-Max超大規模MoE模型,甚至號稱測試表現上優於DeepSeek V3,而阿里巴巴(BABA:NYSE)的美股股價更是收漲6.71%。
根據了解,該研發團隊指出通義千問Qwen 2.5-Max超大規模MoE模型,使用超過20兆token的預訓練數據,及精心設計的後訓練方案進行訓練,並聲稱可以通過API的方式進行訪問,也可以登錄Qwen Chat進行體驗,例如直接與模型對話,或者使用 artifacts及搜索等功能。
廣告 更多內容請繼續往下閱讀
阿里雲跟其他指令模型,包括DeepSeek V3、GPT-4o和Claude-3.5-Sonnet對比性能,在Arena-Hard、LiveBench、LiveCodeBench 和GPQA-Diamond 等基準測試中,Qwen2.5-Max 的表現超越了DeepSeek V3,同時在MMLU-Pro 等其他評估中也展現出了極具競爭力的成績。
在基座模型的對比中,由於無法訪問 GPT-4o 和 Claude-3.5-Sonnet 等閉源模型的基座模型,阿里雲將 Qwen2.5-Max 與目前領先的開源 MoE 模型 DeepSeek V3、最大的開源稠密模型 Llama-3.1-405B,以及同樣位列開源稠密模型前列的 Qwen2.5-72B 進行了對比。
廣告 更多內容請繼續往下閱讀
根據阿里雲研發團隊表示,Qwen2.5-Max的基座模型在大多數基準測試中都展現出了顯著的優勢。研發團隊也強調,隨著後訓練技術的不斷進步,下一個版本的Qwen2.5-Max將會達到更高的水平。
◎《FTNN新聞網》提醒您:本資料僅供參考,投資人應獨立判斷,審慎評估並自負投資風險。
花蓮警撞飛待轉77歲婦!婦滑進車底昏迷 數度命危送醫搶命
伊朗再度處決「以色列間諜」!潛入軍機重地的情蒐方法全揭露
TikTok暫時保命!川普第4度喊卡「禁令延至12月」中美馬德里會談達共識
9月電價凍漲有望?三三會理事長喊「修正能源政策」:不要把問題轉嫁給企業
1歲女兒手指遭門夾傷「發紫流血」 余祥銓心痛自責:以後會更警惕
台灣人怎麼沒感覺?GDP超車韓國636美元!小笠原欣幸戳破「超現實原因」
追不到就狂砍176刀 兇殘死囚王鴻偉21度求再審被駁回 曾阻家人和解以免「到時候沒錢又沒兒子」
快訊/弘仁會再涉詐騙洗錢3.5億!3律師涉洩密「偷拍筆錄」轉交詐團 遭拘提
目標價衝向600元!外資看好「這檔」獲利一路回升到2026 資金湧入成交破160億
中國拿宗教規範納管台灣?內政部霸氣回應:《憲法》保障宗教自由
柯建銘稱協調黨團幹部 賴清德突強調「不能指定、應自主選出」
影/李多慧應援時間忘記跳舞!現場球迷被抓包笑翻XD
台船:7天可打造一艘無人艇!「奮進魔鬼魚」年產40艘
賀瓏神隱4個月突現身!遭薩泰爾切割後近況曝光
連11漲不停!DRAM需求點火「記憶體雙雄」爆量狂飆 法人喊買再上調目標價
影/許瑋甯產後零死角回歸!豪語:要讓兒子覺得媽媽很辣
AI族群集體暴摔!金像電「8月營收衝史高」卻臉綠4天 這光通訊廠翻紅甩開連6跌陰霾
包偉銘、劉依純結婚10年!重拍婚紗照 甜蜜放閃「還在新婚期」
太可惡!1968服務專線也成詐騙受害者 高公局曝已影響緊急事故通報
千萬YTR奇軒練武20年!致敬成龍、甄子丹 「只要走得遠就是贏家」
您已閒置超過五分鐘,請點擊右上角關閉按鈕