發布時間:2025/1/29 16:30
記者洪宗荃/綜合報導
中國國產AI大型語言模型DeepSeek(深度求索)話題持續延燒,不過除了國際矚目之外,國內競爭對手也不甘於後,中國網際網路服務巨頭阿里巴巴,近期也透過旗下的阿里雲,發表了自家的AI語言模型通義千問Qwen 2.5-Max超大規模MoE模型,甚至號稱測試表現上優於DeepSeek V3,而阿里巴巴(BABA:NYSE)的美股股價更是收漲6.71%。
根據了解,該研發團隊指出通義千問Qwen 2.5-Max超大規模MoE模型,使用超過20兆token的預訓練數據,及精心設計的後訓練方案進行訓練,並聲稱可以通過API的方式進行訪問,也可以登錄Qwen Chat進行體驗,例如直接與模型對話,或者使用 artifacts及搜索等功能。
廣告 更多內容請繼續往下閱讀
阿里雲跟其他指令模型,包括DeepSeek V3、GPT-4o和Claude-3.5-Sonnet對比性能,在Arena-Hard、LiveBench、LiveCodeBench 和GPQA-Diamond 等基準測試中,Qwen2.5-Max 的表現超越了DeepSeek V3,同時在MMLU-Pro 等其他評估中也展現出了極具競爭力的成績。
在基座模型的對比中,由於無法訪問 GPT-4o 和 Claude-3.5-Sonnet 等閉源模型的基座模型,阿里雲將 Qwen2.5-Max 與目前領先的開源 MoE 模型 DeepSeek V3、最大的開源稠密模型 Llama-3.1-405B,以及同樣位列開源稠密模型前列的 Qwen2.5-72B 進行了對比。
廣告 更多內容請繼續往下閱讀
根據阿里雲研發團隊表示,Qwen2.5-Max的基座模型在大多數基準測試中都展現出了顯著的優勢。研發團隊也強調,隨著後訓練技術的不斷進步,下一個版本的Qwen2.5-Max將會達到更高的水平。
◎《FTNN新聞網》提醒您:本資料僅供參考,投資人應獨立判斷,審慎評估並自負投資風險。
爸爸曾勸遠離!22歲男大生遭同性伴侶刺死 生前最後發文曝光
中天主播「馬德」捲共諜案!疑涉轉交金流 橋院裁定再延押2個月
喊話第一季淡季不淡!法人點名「2檔低軌衛星」後市可期:2026、2027年動能強
杜拜機場遭無人機襲擊!燃料槽爆炸濃煙竄天 民航局急喊停所有航班
FBI示警伊朗恐襲加州!奧斯卡維安升級 狙擊手、SWAT進駐「軍事級戒備」
一年撿到8.6萬件失物!台鐵新制今實施 逾期每天收45元、交通服務概念股動向受矚目
記憶體族群回神!宇瞻、青雲、晶豪科等5檔飆漲停 多檔個股漲破半根
免驚啦!台灣根本沒斷氣 林楚茵:有政府請安心
影/阿信F3又出事!舞台冒白煙踩不熄 出動7位工作人員緊急處理
GTC也救不起機器人!「這檔」盤中帶量下殺墜跌停…網哀:怎麼突然倒貨 黃仁勳喊話新晶片前所未見
排隊買杜拜巧克力竟吃到「王子麵」!一顆99元惹怒顧客 業者急下架致歉
否認輝達大單!「這轉型封裝大廠」法說會變法會盤中爆量下殺56萬張 網哀:會不會好幾根
訂單排至2027年!「半導體設備廠」連3漲停後陷疲軟 多次觸及跌停再打開
對外投資擺脫中國!賴清德:16年來台灣對中投資從83.8%降至3.75%
川普放話「川習會恐延後」!施壓中國打通荷莫茲海峽 油價飆至106美元
法人預測EPS衝35.7元!台達電2月營收年增31% 電源管理大廠營運火力全開
免費拿「張忠謀自傳」?退休婦誤信投資1200萬蒸發 刑事局:黃仁勳也被冒名
奧斯卡得獎名單揭曉!《Kpop 獵魔女團》抱走動畫長片 《罪人》奪原創劇本、《一戰再戰》拿改編劇本
季減8千股民!00919升息配0.78元今最後買進日 4檔ETF年化配息率衝破10%
荷莫茲海峽斷航「油價狂噴40%」!IEA緊急釋出4億桶救市 原油槓桿ETF受關注
您已閒置超過五分鐘,請點擊右上角關閉按鈕