發布時間:2025/11/16 17:50
實習記者藍彥欣/綜合報導
使用AI幫忙解惑已成為人們日常,但讓各AI軟體考同一份考卷,誰能得到最高分呢?「韓聯社」與延世大學教授金時浩(김시호)的研究團隊對AI聰明度進行實驗,使用ChatGPT(GPT-5)、Gemini(2.5Flash)、Perplexity(Sonar)的免費版本,以及DeepSeek的最新模型,挑戰測驗2026年韓國大學入學考試(대학수학능력시험,簡稱CSAT),科目包括韓語、英語與數學,結果顯示。
根據「韓聯社」報導,研究團隊讓4款熱門AI在有限制的條件下參加考試,實測若這些人工智慧是真正的考生,它們的成績能錄取哪些大學?為了確保測試環境與考試規定和韓國大學入學考試相同,所有的AI禁止搜尋網路,並被要求自行解決問題。
廣告 更多內容請繼續往下閱讀
結果顯示,ChatGPT在「數學」科目成績居高,值得注意的是,今年的數學題目融入了大量高難度題型,因此屬挑戰度較高的考科,但ChatGPT仍表現亮眼,只錯了一題;不過韓語的得分相對較低。
DeepSeek同樣不遜色,它在韓語和英語方面的得分勝過GPT,因數學得分較低,才拉低整體總分平均。
廣告 更多內容請繼續往下閱讀
Gemini在數學方面準確度高,與ChatGPT相似,但可惜在韓語得分墊底,表現不理想。
而居最後一名的是Perplexity,測試過程不僅錯誤率高,甚至拒絕回答題目,而且對於測試時間的掌控度低,此外,還在考試期間使用網路搜尋功能,違反CSAT考試規定,可被視為是作弊的行為。
專家評估,今年的考試結果,沒有一個模型的分數達到被4年制大學錄取的水平。金時浩(김시호)教授表示:「儘管人工智慧模型有日漸顯著進步,但它們在韓語的表現仍無法完全如人意,我們所設想的高層次問題似乎無法解決」。
目標價調升170元!外資評「這電源大廠」今年成長可達29% 喊話持股續抱
蘇打綠馨儀剛拍完戀綜1打5!「記者會上突嘔吐」 遭青峰狂虧:人間獵豹
蘇打綠青峰開年宣告休息整年!命理師建議不要 他鐵了心「就是要跟命運對幹」
晶圓代工兩樣情!台積電續揚創高狂炸528億元 「這檔」才亮燈就翻黑噴量52.5萬張
高畑充希、岡田將生結婚一年有喜了! IG同時宣布升格新手爸媽
賴清德喊話「自由不是免費的」 公開點名藍白:別再擋軍購
NBA/快艇與總管法蘭克續約多年 保羅遭「送回家」後球隊戰績回溫
WBC首戰恐強碰山本由伸先發 曾總:非常興奮
台股收盤漲485點再創高!台積電飆1820元新天價 電器電纜族群猛噴「這檔攻漲停」
梁佑南驚喜加盟8點檔!扮演貴婦服裝竟全被調整 直呼:一切都是最好的安排
新竹縣長選戰最新民調出爐!陳見賢支持度逆勢成長 地方人士預估「有黃金交叉爆發力」
Uber加入北市好孕專車 將有四寶使用?蔣萬安笑稱「要問家裡老闆」
沈玉琳身體狀況好轉!醫評估不必骨髓移植「可回家過年」 最快這時復工
1張現賺27萬元!台達電小金雞「這檔」逢上櫃蜜月…股價猛飆200% 手握熱題材備受矚目
台北市長民調力壓卓榮泰、鄭麗君!王世堅驚呼:不可置信
車銀優陷逃稅爭議延燒!多家品牌火速切割 國防部下架YouTube影片
大S紀念雕像完成!老公具俊曄親自設計 預計離世周年揭幕
影/Lulu婚禮送完客幕後畫面曝光 「浴巾包頭」刷牙超有生活感
史上最接近末日時刻!「末日鐘」調快僅剩85秒 人工智慧、美中侵略都是危害
西西里島暴雨引發4公里山崩 義大利小鎮撤離1500人
您已閒置超過五分鐘,請點擊右上角關閉按鈕