發布時間:2025/1/29 16:30
記者洪宗荃/綜合報導
中國國產AI大型語言模型DeepSeek(深度求索)話題持續延燒,不過除了國際矚目之外,國內競爭對手也不甘於後,中國網際網路服務巨頭阿里巴巴,近期也透過旗下的阿里雲,發表了自家的AI語言模型通義千問Qwen 2.5-Max超大規模MoE模型,甚至號稱測試表現上優於DeepSeek V3,而阿里巴巴(BABA:NYSE)的美股股價更是收漲6.71%。
根據了解,該研發團隊指出通義千問Qwen 2.5-Max超大規模MoE模型,使用超過20兆token的預訓練數據,及精心設計的後訓練方案進行訓練,並聲稱可以通過API的方式進行訪問,也可以登錄Qwen Chat進行體驗,例如直接與模型對話,或者使用 artifacts及搜索等功能。
廣告 更多內容請繼續往下閱讀
阿里雲跟其他指令模型,包括DeepSeek V3、GPT-4o和Claude-3.5-Sonnet對比性能,在Arena-Hard、LiveBench、LiveCodeBench 和GPQA-Diamond 等基準測試中,Qwen2.5-Max 的表現超越了DeepSeek V3,同時在MMLU-Pro 等其他評估中也展現出了極具競爭力的成績。
在基座模型的對比中,由於無法訪問 GPT-4o 和 Claude-3.5-Sonnet 等閉源模型的基座模型,阿里雲將 Qwen2.5-Max 與目前領先的開源 MoE 模型 DeepSeek V3、最大的開源稠密模型 Llama-3.1-405B,以及同樣位列開源稠密模型前列的 Qwen2.5-72B 進行了對比。
廣告 更多內容請繼續往下閱讀
根據阿里雲研發團隊表示,Qwen2.5-Max的基座模型在大多數基準測試中都展現出了顯著的優勢。研發團隊也強調,隨著後訓練技術的不斷進步,下一個版本的Qwen2.5-Max將會達到更高的水平。
◎《FTNN新聞網》提醒您:本資料僅供參考,投資人應獨立判斷,審慎評估並自負投資風險。
存股族緊盯8月ETF除息秀!00878逾173萬股民齊搶 黑馬00961年化配息率近10%吸睛
台灣關稅20%怎麼救?盧秀燕出手了「不光是發錢」還要拓展潛力市場
魏如萱剛認愛...Ian又被拍與若盈親密約會 深夜突喊分手:是時候離開對方
這檔遭投信出清12日!國家隊敲進逾4千張輸血 另猛砸41億進貨2檔半導體股
新莊驚悚紅箱藏屍案!輕度身障兒涉嫌弒父棄屍水溝 遭羈押禁見
雨下不完!氣象署曝「西南風再度增強」 最新熱帶低壓恐成颱
美國製造打天下?4檔漲停個股強攻強勢股王…「這檔」創11年新高價 股價連噴49%
快訊/凌晨豪雨狂炸!7小時破200毫米 台南宣布今停班停課
就業疲軟美股盡墨!道瓊暴跌542點、那指崩472點 台積電ADR下挫2.67%
人財兩失釀殺機?女公關親妹斥凶嫌說謊 嘆「槍決只是一瞬間,家屬的痛是永遠」
嗆黃光芹是瘋狗!民眾黨中配「備位立委」被停權後道歉了 他涉詐欺也遭鍘
不聽勸硬要闖!南投57歲男騎車衝進淹水路段 慘遭滅頂溺斃
飯店業活教科書1/他逆勢創業 要做旅宿香奈兒
高醫糗討死人債1/向死人討債遭譏「孟婆支付」 爆高醫遭法院打臉鬧笑話
20%關稅嚇壞台股!這檔卻連噴2根漲停板 國家隊宰了回補上億元
關稅+232條款風暴翻了台灣屋頂!忙大罷免疏於執政的賴政府該拿出辦法了
川普關稅恐衝擊全球經濟!美股四大指數大跳水...道瓊狂跌549.07點 台積電ADR重挫2.72%
台灣吞20%關稅!三大法人2天砸72億狂買鴻海 「這2檔」沒在怕逆勢上漲
龐大代價換取關稅15%!日韓砸千億美元投資 網炸鍋:美國已經統治地球
才剛終結兩季虧損!這檔卻暴跌9日淪弱勢股王 股民怨:廢材扶不起