發布時間:2025/11/16 17:50
實習記者藍彥欣/綜合報導
使用AI幫忙解惑已成為人們日常,但讓各AI軟體考同一份考卷,誰能得到最高分呢?「韓聯社」與延世大學教授金時浩(김시호)的研究團隊對AI聰明度進行實驗,使用ChatGPT(GPT-5)、Gemini(2.5Flash)、Perplexity(Sonar)的免費版本,以及DeepSeek的最新模型,挑戰測驗2026年韓國大學入學考試(대학수학능력시험,簡稱CSAT),科目包括韓語、英語與數學,結果顯示。
根據「韓聯社」報導,研究團隊讓4款熱門AI在有限制的條件下參加考試,實測若這些人工智慧是真正的考生,它們的成績能錄取哪些大學?為了確保測試環境與考試規定和韓國大學入學考試相同,所有的AI禁止搜尋網路,並被要求自行解決問題。
廣告 更多內容請繼續往下閱讀
結果顯示,ChatGPT在「數學」科目成績居高,值得注意的是,今年的數學題目融入了大量高難度題型,因此屬挑戰度較高的考科,但ChatGPT仍表現亮眼,只錯了一題;不過韓語的得分相對較低。
DeepSeek同樣不遜色,它在韓語和英語方面的得分勝過GPT,因數學得分較低,才拉低整體總分平均。
廣告 更多內容請繼續往下閱讀
Gemini在數學方面準確度高,與ChatGPT相似,但可惜在韓語得分墊底,表現不理想。
而居最後一名的是Perplexity,測試過程不僅錯誤率高,甚至拒絕回答題目,而且對於測試時間的掌控度低,此外,還在考試期間使用網路搜尋功能,違反CSAT考試規定,可被視為是作弊的行為。
專家評估,今年的考試結果,沒有一個模型的分數達到被4年制大學錄取的水平。金時浩(김시호)教授表示:「儘管人工智慧模型有日漸顯著進步,但它們在韓語的表現仍無法完全如人意,我們所設想的高層次問題似乎無法解決」。
78歲母「神祕副收入」曝光!兒子以為她月領1.2萬生活拮据 實際月收10萬
Q3獲利寫下新紀錄!這「代工大廠」仍遭三大法人重砍5萬張 再提款台積電487億...續丟第6週
應材營收獲利優於市場預期!法人看好「這檔」需求、營運正向 第三季營收創歷史新高
你應得的!Andy老師首拿走鐘獎就奪最大獎 網見「這一幕」感動喊:他終於有錢了
發雞排跳票「放鳥400人」引眾怒!台大發聲:應理性明辨網路訊息 地理系學生出手救援
記憶體熱到燙手!「它」股價改寫新高 法人上修目標價1420元看旺到2026
少林寺前住持釋永信擁多名情婦、私生子!今再爆出侵占寺院資產 遭3罪正式逮捕
正宗「珍珠奶茶」遠征英國!落腳陶瓷之都 食材台灣進口「珍珠每天現做」
佘詩曼搏命演出!8樓高空開機門 現場人員全被嚇出冷汗
大樂透6.91億沒得到別難過!今彩539頭獎連開四注 台北、台中、屏東4人各得6百萬
大氣系網友人呢?「賭輸發雞排」民眾苦等遭放鳥 網酸:改名小氣系
新竹城市馬拉松今登場!1萬3700名跑者穿梭風城 肯亞選手「霸榜」成最大贏家
AI四大巨頭測大學入學考試!ChatGPT輕鬆解高難度題型 「這軟體」涉作弊
傳奪台積電CoWoS訂單!這「AI材料黑馬」躍升矽光子+3D IC國家隊 20號法說會成焦點
阿Ken曝無法與安心亞交往原因!自揭理想型 「找尋我的陶晶瑩」
普發1萬明天ATM登場!這16家銀行可以領 各家優惠一次看
納智捷加持噴瘋了!傳小金雞將賣鴻海集團…「這檔」股價連拉3根 創近7個月新高
川普105億狂掃債券震撼!網疑惑債券利多在哪...他點1資產真相:有錢人確實都「這樣做」
台中婦圖書館看書竟遭蛇吻!30cm眼鏡蛇狠咬腳背 急送醫救治
玖壹壹音樂節開唱!阿倉極限鐵人賽後趕來 睡2小時照樣嗨
您已閒置超過五分鐘,請點擊右上角關閉按鈕