發布時間:2025/1/29 16:30
記者洪宗荃/綜合報導
中國國產AI大型語言模型DeepSeek(深度求索)話題持續延燒,不過除了國際矚目之外,國內競爭對手也不甘於後,中國網際網路服務巨頭阿里巴巴,近期也透過旗下的阿里雲,發表了自家的AI語言模型通義千問Qwen 2.5-Max超大規模MoE模型,甚至號稱測試表現上優於DeepSeek V3,而阿里巴巴(BABA:NYSE)的美股股價更是收漲6.71%。
根據了解,該研發團隊指出通義千問Qwen 2.5-Max超大規模MoE模型,使用超過20兆token的預訓練數據,及精心設計的後訓練方案進行訓練,並聲稱可以通過API的方式進行訪問,也可以登錄Qwen Chat進行體驗,例如直接與模型對話,或者使用 artifacts及搜索等功能。
廣告 更多內容請繼續往下閱讀
阿里雲跟其他指令模型,包括DeepSeek V3、GPT-4o和Claude-3.5-Sonnet對比性能,在Arena-Hard、LiveBench、LiveCodeBench 和GPQA-Diamond 等基準測試中,Qwen2.5-Max 的表現超越了DeepSeek V3,同時在MMLU-Pro 等其他評估中也展現出了極具競爭力的成績。
在基座模型的對比中,由於無法訪問 GPT-4o 和 Claude-3.5-Sonnet 等閉源模型的基座模型,阿里雲將 Qwen2.5-Max 與目前領先的開源 MoE 模型 DeepSeek V3、最大的開源稠密模型 Llama-3.1-405B,以及同樣位列開源稠密模型前列的 Qwen2.5-72B 進行了對比。
廣告 更多內容請繼續往下閱讀
根據阿里雲研發團隊表示,Qwen2.5-Max的基座模型在大多數基準測試中都展現出了顯著的優勢。研發團隊也強調,隨著後訓練技術的不斷進步,下一個版本的Qwen2.5-Max將會達到更高的水平。
◎《FTNN新聞網》提醒您:本資料僅供參考,投資人應獨立判斷,審慎評估並自負投資風險。
官方臉書直播民眾黨反罷免宣講「竹市府致上最深歉意」 楊寶楨:廠商操作不當、會以此為鑑
陳水扁病床照曝光!臉色蒼白憔悴 連日血便…胃鏡切8顆瘜肉
台股陷弱勢失守22000點!台塑4寶卻逆勢勁揚 台塑化一度飆破半根
美妝界傳奇落幕!雅詩蘭黛董事雷納德蘭黛辭世 享耆壽92歲
00919季配0.72元暴增15萬股東!13檔上市ETF最後上車日 「暴力配ETF」年化配息率僅1.87%
南橫明霸克露橋路段又遭豪雨重創 公路局急闢「緊急通行便道」每日僅開放5時段
華為、中芯全入榜!經濟部出口管制名單新增破6百個 關鍵考量曝光
郭富城升格三寶爸!證實愛妻懷孕喜訊 笑稱:家裡越熱鬧越好
台積電挫10元、廣達跌1%!聯發科漲1%強撐 台股開低跌136點「失守22000大關」
中東戰火蔓延…「這檔」無人機上市首日暴漲140%! 市值一度逼近2.9兆
快訊/失聯19歲高職生找到了!枋寮戲水案最後一人 今晨尋獲已溺亡
5月EPS狂飆1933%...電器電纜「這檔」爆量殺低 當沖比逾7成慘封韭菜王
館長上海行賺翻!光抖內就破135萬 他估「5天總收益」數字超驚人
桃機第三航廈要來了!三航北登機廊廳下半年啟用 7月份起展開動線測試
中東地緣政治緊張情勢升溫!中油柴油要漲了 最新油價一次看
魏哲家喊「有多少買多少」...綠電股瘋了!這檔興櫃首日股價狂飆近3倍 引爆能源IPO熱潮
借券賣出爆量異常!00919「5新兵」入列14檔注意股 貿聯-KY「噴漲135元」也被盯
闖養殖場撿2顆海膽!金馬影帝李康生涉竊盜送辦 自嘲「美麗的誤會」:已捐款和解
伊朗新一波飛彈攻勢 以色列:多個地點遭到擊中
館長陳之漢返台 將投入阻止大罷免