發布時間:2025/1/29 16:30
記者洪宗荃/綜合報導
中國國產AI大型語言模型DeepSeek(深度求索)話題持續延燒,不過除了國際矚目之外,國內競爭對手也不甘於後,中國網際網路服務巨頭阿里巴巴,近期也透過旗下的阿里雲,發表了自家的AI語言模型通義千問Qwen 2.5-Max超大規模MoE模型,甚至號稱測試表現上優於DeepSeek V3,而阿里巴巴(BABA:NYSE)的美股股價更是收漲6.71%。
根據了解,該研發團隊指出通義千問Qwen 2.5-Max超大規模MoE模型,使用超過20兆token的預訓練數據,及精心設計的後訓練方案進行訓練,並聲稱可以通過API的方式進行訪問,也可以登錄Qwen Chat進行體驗,例如直接與模型對話,或者使用 artifacts及搜索等功能。
廣告 更多內容請繼續往下閱讀
阿里雲跟其他指令模型,包括DeepSeek V3、GPT-4o和Claude-3.5-Sonnet對比性能,在Arena-Hard、LiveBench、LiveCodeBench 和GPQA-Diamond 等基準測試中,Qwen2.5-Max 的表現超越了DeepSeek V3,同時在MMLU-Pro 等其他評估中也展現出了極具競爭力的成績。
在基座模型的對比中,由於無法訪問 GPT-4o 和 Claude-3.5-Sonnet 等閉源模型的基座模型,阿里雲將 Qwen2.5-Max 與目前領先的開源 MoE 模型 DeepSeek V3、最大的開源稠密模型 Llama-3.1-405B,以及同樣位列開源稠密模型前列的 Qwen2.5-72B 進行了對比。
廣告 更多內容請繼續往下閱讀
根據阿里雲研發團隊表示,Qwen2.5-Max的基座模型在大多數基準測試中都展現出了顯著的優勢。研發團隊也強調,隨著後訓練技術的不斷進步,下一個版本的Qwen2.5-Max將會達到更高的水平。
◎《FTNN新聞網》提醒您:本資料僅供參考,投資人應獨立判斷,審慎評估並自負投資風險。
AI全面上攻...美股四大指數大漲!那斯達克飆348點 輝達、台積電ADR皆漲近4%
銀彈上膛瞄準發射!八大公股月撒40億狂掃「它」13萬張 「這5檔ETF」同步吸金破10億
仙人指路或彈盡糧絕?馬斯克喊明年人形機器人增10倍 主力卻大砍「這檔」近萬張...股民:上面冤魂多
股利配發創新高!長老卻狂丟「它」破3萬張 晶圓製造概念股「這檔」也難逃...遭提款11億
專挑老黃概念股下手?自營商4月倒「這2檔」破萬張 鴻海、光寶科也遭殃
中美關稅互不讓步!中國也防美國「洗產地」 出動高科技嚴抓美國黃豆
現金股利5元!這檔「記憶體模組廠」力抗關稅衝擊 散熱技術突破瓶頸...現金殖利率近6%
鞋底抹油趕緊跑!三大法人獵殺「這檔」得手11.6億 單月暴砍「它」13.4萬張
AI熱潮助攻!這檔「PCB大廠」首季獲利創新高 年增75%...目標價上調4.49%
健身館員工遭偷襲受傷還被政治謾罵 報警抓不到人館長拍片痛訴「台灣人講政治要打打殺殺嗎」
與英特爾合作順利!三大法人橫掃聯電破12萬張 輝達概念股「這檔」今年訂單續揚...遭猛砸78億攬入
閃兵外案!王大陸情侶動人脈「查個資」…相關6人遭北檢起訴 四海幫堂主、好友交保
逃亡7年歸案!貴婦奈奈200萬交保 需戴電子腳環、限制出入境
遭廖峻3子女告竊盜!女助理交出「房契、銀行存摺」:緣起緣滅 律師聲明全文曝光
外資砍飛了!1類股本月遭倒破22萬張…回補數十億 「這10檔」也慘兮兮
美國恐要求新台幣升值?央行闢謠:與事實不符
如果又股災怎麼辦?美關稅不定…他問是否該留後路 網推1「進場公式」:誰管最低點
川普鬆口!有望與「印日韓」達貿易協議 親吐談判破局下場
外資4月大買「這檔」破18萬張!中華電股災中秀抗跌 也獲破4萬張進貨
溫哥華汽車衝撞釀11死!台女打工度假遭撞飛 「重傷昏迷」駐處全力協助