發布時間:2025/11/16 17:50
實習記者藍彥欣/綜合報導
使用AI幫忙解惑已成為人們日常,但讓各AI軟體考同一份考卷,誰能得到最高分呢?「韓聯社」與延世大學教授金時浩(김시호)的研究團隊對AI聰明度進行實驗,使用ChatGPT(GPT-5)、Gemini(2.5Flash)、Perplexity(Sonar)的免費版本,以及DeepSeek的最新模型,挑戰測驗2026年韓國大學入學考試(대학수학능력시험,簡稱CSAT),科目包括韓語、英語與數學,結果顯示。
根據「韓聯社」報導,研究團隊讓4款熱門AI在有限制的條件下參加考試,實測若這些人工智慧是真正的考生,它們的成績能錄取哪些大學?為了確保測試環境與考試規定和韓國大學入學考試相同,所有的AI禁止搜尋網路,並被要求自行解決問題。
廣告 更多內容請繼續往下閱讀
結果顯示,ChatGPT在「數學」科目成績居高,值得注意的是,今年的數學題目融入了大量高難度題型,因此屬挑戰度較高的考科,但ChatGPT仍表現亮眼,只錯了一題;不過韓語的得分相對較低。
DeepSeek同樣不遜色,它在韓語和英語方面的得分勝過GPT,因數學得分較低,才拉低整體總分平均。
廣告 更多內容請繼續往下閱讀
Gemini在數學方面準確度高,與ChatGPT相似,但可惜在韓語得分墊底,表現不理想。
而居最後一名的是Perplexity,測試過程不僅錯誤率高,甚至拒絕回答題目,而且對於測試時間的掌控度低,此外,還在考試期間使用網路搜尋功能,違反CSAT考試規定,可被視為是作弊的行為。
專家評估,今年的考試結果,沒有一個模型的分數達到被4年制大學錄取的水平。金時浩(김시호)教授表示:「儘管人工智慧模型有日漸顯著進步,但它們在韓語的表現仍無法完全如人意,我們所設想的高層次問題似乎無法解決」。
最高目標價達660元!9大外資+7大內資點名看好「這半導體封測廠」 喊話營收拚翻倍超吸金
「鄭麗文工作就是賣台!」劉寶傑砲轟:敢擋軍購我詛咒你
砲指韓國瑜 季麟連「膛炸」
本業回溫難止血!「面板指標大廠」首季轉虧 每股虧損0.15元
PCB群起飆漲!「這檔」連拉5根領5檔同步漲停 欣興、南電、臻鼎等載板全亮燈寫新高
「自由台灣」能改變張凌赫?梁文傑:戲裡是將軍 現實仍得聽中共
上修獲利卻喊賣!聯電「目標價喊高74元」Q2再轉強 外資評等偏空原因曝光
成人片男星消失2年!「改名重新出發」 曝因名利迷失自我
9刀刺殺技術長!雲云科技前董座哽咽認罪 一審判無期徒刑
影/李多慧慘遭經紀人「惡剪」!? 崩潰反應全網笑翻
政治讀新術/配合鄭麗文挺3500億+N?她曝傅崐萁盤算:韓國瑜被除名就能當院長
首季獲利年增3507%!「矽晶圓廠」一字鎖第3根漲停、半導體42檔同勁揚 旺宏連4漲斷線
「我們歡迎大陸朋友來台參加同志運動會」 梁文傑坦言:中國不可能放行
政府發錢、5月現金紅包報到!最高爽領4萬 19筆小確幸陸續發
影/秦昊「對老婆反應冷淡」被網質疑婚變 伊能靜曝私下相處模試喊:你們開心就好
淨賺243億元季增5.6%!聯發科Q1財報出爐 EPS為15.17元
陸籍生繁星上台大卻因「這原因」被擋 梁文傑:不會對個案開特例
影/林志玲登《不熙娣》合體小S 哽咽淚喊:很心疼妳
林亮君控國票證高層再爆霸凌!逼受害員工簽「承諾書」撤回申訴
重點在「川習會」前川普可能不決定軍售金額 前藍委陳以信批川普政府:掛鉤對台軍售與美中關係違反「六項保證」
您已閒置超過五分鐘,請點擊右上角關閉按鈕