發布時間:2025/11/16 17:50
實習記者藍彥欣/綜合報導
使用AI幫忙解惑已成為人們日常,但讓各AI軟體考同一份考卷,誰能得到最高分呢?「韓聯社」與延世大學教授金時浩(김시호)的研究團隊對AI聰明度進行實驗,使用ChatGPT(GPT-5)、Gemini(2.5Flash)、Perplexity(Sonar)的免費版本,以及DeepSeek的最新模型,挑戰測驗2026年韓國大學入學考試(대학수학능력시험,簡稱CSAT),科目包括韓語、英語與數學,結果顯示。
根據「韓聯社」報導,研究團隊讓4款熱門AI在有限制的條件下參加考試,實測若這些人工智慧是真正的考生,它們的成績能錄取哪些大學?為了確保測試環境與考試規定和韓國大學入學考試相同,所有的AI禁止搜尋網路,並被要求自行解決問題。
廣告 更多內容請繼續往下閱讀
結果顯示,ChatGPT在「數學」科目成績居高,值得注意的是,今年的數學題目融入了大量高難度題型,因此屬挑戰度較高的考科,但ChatGPT仍表現亮眼,只錯了一題;不過韓語的得分相對較低。
DeepSeek同樣不遜色,它在韓語和英語方面的得分勝過GPT,因數學得分較低,才拉低整體總分平均。
廣告 更多內容請繼續往下閱讀
Gemini在數學方面準確度高,與ChatGPT相似,但可惜在韓語得分墊底,表現不理想。
而居最後一名的是Perplexity,測試過程不僅錯誤率高,甚至拒絕回答題目,而且對於測試時間的掌控度低,此外,還在考試期間使用網路搜尋功能,違反CSAT考試規定,可被視為是作弊的行為。
專家評估,今年的考試結果,沒有一個模型的分數達到被4年制大學錄取的水平。金時浩(김시호)教授表示:「儘管人工智慧模型有日漸顯著進步,但它們在韓語的表現仍無法完全如人意,我們所設想的高層次問題似乎無法解決」。
太陽能搭「AI1」衛星升空!「這檔」外資狂掃、國家隊調節近6000張 國碩漲破12%也被抽回2億元
SCFI迎連7周上漲!法人看好6月運價續高 貨櫃三雄Q2獲利看旺
5月營收翻漲近2倍!「記憶體大廠」漲停噴量21萬張 三大法人整周大投80億元搜刮
尼克睽違53年成功奪冠!紐約街頭陷入瘋狂 巴士遭燒毀、少年中槍
百萬股民歡呼了!00919、00981A公告配息由「資本利得」組成 不納入綜所稅、免繳補充保費
訂單滿到2030年!「PCB大廠」目標價喊上1000元 800G、1.6T應用報價噴2.5倍EPS攻14元
遭列處置狂跌逾22%!「這檔記憶體」獲國家隊止血搶進1.4萬張 南亞科也迎注資22億元
又一兆元IPO登陸美國!「記憶體巨頭」傳將於8月在納斯達克上市
除息首日上演「秒填息」!「這檔高息ETF」單周被國家隊出清4113張 再從00878收回12億元
晶圓代工被盯上!三大法人狠賣「這2檔」22.4萬張 連殺聯電4周回收414億元
蔣萬安喊廢監院 賴士葆列監委過去「政治辦案」紀錄:廢除已成全民共識
光電大廠「晶采」董事長驚傳辭世!公司急發重訊證實
外公是「西安事變」張學良!黃大煒生前親曝超強家世背景 拍背叮囑:要有骨氣要愛國
5月漲幅贏過大盤!「這檔主動式」外資單周押寶1.8萬張 00992A、00982A全在補貨名單
德國人大讚台灣交通!初見1「暖舉」被惹哭 喊話:外國月亮沒有比較圓
黃大煒驚傳驟逝!康康痛失19年摯友難接受 沉重回應:讓我平復一下
白宮變身格鬥場!川普豪砸19億辦80歲狂歡壽宴 學者痛批「古羅馬的麵包與馬戲」
影/王陽明大秀「超狂琴技」!?網笑:彈的很好但下次別彈了XD
影/全世界 FEARNOT 都看錯!前 TPE48 李采潔「激似金采源」 一比一神複製挑戰〈BOOMPALA〉掀熱議
藍綠都喊廢監院卻不做 張景森轟「說一套、做一套」:台灣政治最可恥的地方
您已閒置超過五分鐘,請點擊右上角關閉按鈕