發布時間:2025/11/16 17:50
實習記者藍彥欣/綜合報導
使用AI幫忙解惑已成為人們日常,但讓各AI軟體考同一份考卷,誰能得到最高分呢?「韓聯社」與延世大學教授金時浩(김시호)的研究團隊對AI聰明度進行實驗,使用ChatGPT(GPT-5)、Gemini(2.5Flash)、Perplexity(Sonar)的免費版本,以及DeepSeek的最新模型,挑戰測驗2026年韓國大學入學考試(대학수학능력시험,簡稱CSAT),科目包括韓語、英語與數學,結果顯示。
根據「韓聯社」報導,研究團隊讓4款熱門AI在有限制的條件下參加考試,實測若這些人工智慧是真正的考生,它們的成績能錄取哪些大學?為了確保測試環境與考試規定和韓國大學入學考試相同,所有的AI禁止搜尋網路,並被要求自行解決問題。
廣告 更多內容請繼續往下閱讀
結果顯示,ChatGPT在「數學」科目成績居高,值得注意的是,今年的數學題目融入了大量高難度題型,因此屬挑戰度較高的考科,但ChatGPT仍表現亮眼,只錯了一題;不過韓語的得分相對較低。
DeepSeek同樣不遜色,它在韓語和英語方面的得分勝過GPT,因數學得分較低,才拉低整體總分平均。
廣告 更多內容請繼續往下閱讀
Gemini在數學方面準確度高,與ChatGPT相似,但可惜在韓語得分墊底,表現不理想。
而居最後一名的是Perplexity,測試過程不僅錯誤率高,甚至拒絕回答題目,而且對於測試時間的掌控度低,此外,還在考試期間使用網路搜尋功能,違反CSAT考試規定,可被視為是作弊的行為。
專家評估,今年的考試結果,沒有一個模型的分數達到被4年制大學錄取的水平。金時浩(김시호)教授表示:「儘管人工智慧模型有日漸顯著進步,但它們在韓語的表現仍無法完全如人意,我們所設想的高層次問題似乎無法解決」。
AI伺服器有料!自營商加碼「這3檔」7千多張 注資16.2億連4週掃貨緯創
光通訊軍備競賽白熱化!上詮、波若威火力全開搶攻CPO與FAU 下半年量產行情蓄勢爆發
油價飆、關稅壓!「這些工具機大廠」嚇壞了 警鐘大作:今年景氣恐急轉直下
記者播報新聞語帶哽咽,OK嗎?
00919明最後買進日!國家隊週撒19億加碼8萬張「天天囤貨」 這檔高息ETF也被打包帶走
材料王再衝天價!台光電「狂賺逾一股本」股價飆上2,705元新高 高階CCL需求爆發
AI浪潮傳產式微?這重電大廠從30元漲成千金股 「錢途」不可限量
重金懸賞!美國開伊朗10高層名單求情報 祭3.2億賞金+全家移民誘人條件
全年EPS達4.48元!「這檔矽光子」週拉2根漲停噴24.3%創高 打進博通CPO供應鏈營收衝高
台中豐原驚悚情殺!62歲狠男鐮刀「割喉」女友 載屍自首遭聲押禁見
高雄櫻花季/李泳知再登櫻花季!辣曬長腿 烙台語問粉絲「我美嗎」
日本職場驚傳霸凌!44歲男主管祭出超噁懲罰 逼OL吃「蟲蟲火鍋」抵罰金
台股急跌2000點又神速反彈!他喊租屋買股「賺得快又多」 買房置產派戰翻
一週天氣大洗三溫暖!清晨低溫「白天回暖衝30度高溫」 下波變天時間曝
小兒護愛!外資狂賣台股2378億 力挺面板雙雄瘋掃逾24萬張霸榜
高雄櫻花季/HIGHLIGHT二訪高雄!他愛上當地美食不想走 嘴甜狂讚「最美風景是粉絲」
2月EPS 2.14元!「PCB大廠」飆連4漲22.86%寫新天價 多家CSP客戶ASIC即將量產前景看俏
2月營收月減15%!投信單週提款精成科5.7億 這檔擬發股利1.4元也被丟逾5千張
才向妻傳訊「我發生山難」!退休男課長獨攀西巒大山失聯 5天後尋獲已身亡
法說會變法會、官股投顧補槍降評!自營商週殺群創1.3萬張 「電源大廠」慘被刀32億
您已閒置超過五分鐘,請點擊右上角關閉按鈕