發布時間:2025/1/29 16:30
記者洪宗荃/綜合報導
中國國產AI大型語言模型DeepSeek(深度求索)話題持續延燒,不過除了國際矚目之外,國內競爭對手也不甘於後,中國網際網路服務巨頭阿里巴巴,近期也透過旗下的阿里雲,發表了自家的AI語言模型通義千問Qwen 2.5-Max超大規模MoE模型,甚至號稱測試表現上優於DeepSeek V3,而阿里巴巴(BABA:NYSE)的美股股價更是收漲6.71%。
根據了解,該研發團隊指出通義千問Qwen 2.5-Max超大規模MoE模型,使用超過20兆token的預訓練數據,及精心設計的後訓練方案進行訓練,並聲稱可以通過API的方式進行訪問,也可以登錄Qwen Chat進行體驗,例如直接與模型對話,或者使用 artifacts及搜索等功能。
廣告 更多內容請繼續往下閱讀
阿里雲跟其他指令模型,包括DeepSeek V3、GPT-4o和Claude-3.5-Sonnet對比性能,在Arena-Hard、LiveBench、LiveCodeBench 和GPQA-Diamond 等基準測試中,Qwen2.5-Max 的表現超越了DeepSeek V3,同時在MMLU-Pro 等其他評估中也展現出了極具競爭力的成績。
在基座模型的對比中,由於無法訪問 GPT-4o 和 Claude-3.5-Sonnet 等閉源模型的基座模型,阿里雲將 Qwen2.5-Max 與目前領先的開源 MoE 模型 DeepSeek V3、最大的開源稠密模型 Llama-3.1-405B,以及同樣位列開源稠密模型前列的 Qwen2.5-72B 進行了對比。
廣告 更多內容請繼續往下閱讀
根據阿里雲研發團隊表示,Qwen2.5-Max的基座模型在大多數基準測試中都展現出了顯著的優勢。研發團隊也強調,隨著後訓練技術的不斷進步,下一個版本的Qwen2.5-Max將會達到更高的水平。
◎《FTNN新聞網》提醒您:本資料僅供參考,投資人應獨立判斷,審慎評估並自負投資風險。
保全自拍監視器畫面喊「房間隨我看」!北海洲際酒店急澄清「監視系統未涉及客房」:已報警
網友驚賴清德、李四川僅差一歲 川伯笑談「常下工地」
潘奕如晉升為「星媽」!帶愛鳥進劇組萌翻 親曝與牠「生命緣分」
民眾黨五一前夕批賴清德勞動政見屢跳票 推五大修法不讓勞工「做功德」
梁家榕心疼父親!生活中心從沙發移到床上 楊鎮憶父開腦瞬間長大
機器人5檔噴上漲停板!「微型線性滑軌廠」力拼連5紅 所羅門11檔齊彈半根
衝80.9元創25年新高!聯電庫藏股、法說利多助攻 湧23萬張奪冠
ETF市場全面回暖!「人氣王」盤中湧27萬張大量止跌回升 原油飆破120美元00673R超慘狂跌14%
陳佩琪不滿「柯文哲比賴清德的狗還不如」 本人感性回應曝光
K-SPARK拼盤演唱會華麗卡司公開!「確定G-Dragon、泰妍夢幻聯動」 售票資訊看這裡
季麟連常會罕見發言給媒體拍被猜「刻意安排」 鄭麗文留言韓國瑜「辛苦了」被圍剿
28歲女警魂斷車下!肇事女大生遭爆「完全沒有悔過的樣子」:跟同學開心聊天
目標價暴衝至1350元!「這載板大廠」EPS預估45.06元 產能全賣光、長約鎖7年掀超級循環
低軌衛星回神起飛!「砷化鎵大廠」閃現漲停、華通28檔同步勁揚 精測獨跌4%最苦
金鐘影帝樊光耀最赤裸演出!挑戰大尺度情慾戲 自曝:變態得很有理
陳佩琪嗆「柯文哲不如殘障三腳狗」惹議 陳智菡替她抱屈這件事
3月獲利暴增858%!「這光通訊廠」單月EPS達2.85元 開盤跳空漲停「破千張排隊搶買進」
還會哼《飛龍在天》主題曲!賈靜雯曝未來目標 想體驗當導演的世界
矽光子紅燈齊發!「這檔」週拉2根衝30.6%寫新天價 聯亞、波若威、穩懋等7檔全漲停
Alphabet亮眼財報助攻!聯發科訂單看旺早盤狂飆4% 法說會前吸金
您已閒置超過五分鐘,請點擊右上角關閉按鈕