發布時間:2025/6/29 13:35
全球最先進的人工智慧(AI)模型正展現出令人不安的行為模式:為了達到目標,不惜扯謊、算計,甚至威脅它們的創作者。
法新社報導,其中一個最令人瞠目結舌的案例中,AI業者Anthropic最新發布的Claude 4在遭面臨拔插頭的斷電威脅時會出手反擊,勒索1名工程師揚言將揭穿一起婚外情。
廣告 更多內容請繼續往下閱讀
另外,熱門聊天機器人ChatGPT美國開發商OpenAI的o1試圖把自己下載至外部伺服器,被抓包時竟會矢口否認。
這幾個例子說明了一個需嚴肅看待的現實:ChatGPT推出引發風潮至今2年多,AI研究人員仍未充分了解自己究竟創造了什麼。
廣告 更多內容請繼續往下閱讀
然而,各界仍爭先恐後地部署性能愈發強大的AI模型。
AI這類「騙人」行為似與新興「推理」模型有關,這類AI系統會逐步推導問題,而非立刻產生答案。
英國獨立AI研究機構Apollo Research負責人霍布漢(Marius Hobbhahn)說:「o1是我們首次在大型模式中觀察到這種行為。」他表示,這些模型有時會表面上遵循指令,但實際上卻暗中追求不同目標。
目前,AI這種欺騙行為,只有在研究人員蓄意以極端情境對模型進行壓力測試時才會出現。
儘管如此,評估機構METR的麥可.陳(Michael Chen,音譯)警告說:「未來性能更強大的模型究竟會傾向於誠實還是欺騙,這仍是一個懸而未決的問題。」
(中央社)
谷底翻身?美系外資看好「這2檔」股價強噴…八大官股合計狂甩9萬張 軍工股「它」也被出貨
股價有望挑戰歷史高點!這檔大嗑「軍工+遊戲」 第2季「三率三升」外資連13買
「這檔老字號」代理兩岸「輝達機器人大腦」 外資不買帳「連18砍」賣飛3.8萬張
小兒看不下去?外資8月狂殺「這檔」7.8萬張喊目標價下修 「它」月跌幅破7%網哀:韭菜人踩人
哲哲選的好股票?三大法人8月瘋倒「它」7.8萬張...提款204億 老AI緯創也被重砍15萬張
不用熬夜盯盤!南韓上班族連虧18年大逆轉 靠「超普通3原則」滾出2.2億
川普關稅違法!彭博搓破1伏筆 「這國」爽翻天、亞洲談判急踩煞車
三大法人人氣王是它!外資、投信、自營商都搶瘋了 「這檔」月漲幅飆21%也被寵…網嗨:那麼香
配息調升132%!高息ETF「年化配息率逾6%」明最後買進日 7檔ETF本周除息一表看
大師發功!這檔「輝達機器人大腦」週漲52%輾壓研華、宜鼎 連亮4燈「5.8萬張等買」
中壢民宅惡火奪5命!初判電風扇電線被壓釀災 1大4小死因相驗曝光
超不服氣!中國選手輸給林昀儒情緒暴走 「怒砸球拍」慘遭停賽
頂流男星人設崩塌?王鶴棣秘戀音檔瘋傳 「私生飯」被拘前仍否認造謠
鴻海AI火力全開!受惠輝達超級電腦、雲端營收飆升 外資8月狂買699億登榜首
布魯斯威利近況曝光!失語症惡化「不記得自己是明星」妻子含淚送專業機構照護
離岸風電喊卡!認賠724億...成本飆2倍撐不住 三菱商事宣布退出3大風場
老AI利多不漲?投信重殺緯創7.8萬張、廣達也受難 東元強漲33%遭結帳9.4億
老牌電子股衝刺!「它」AI布局拉動營收 投信8月豪砸44億加碼逾3萬張
第一金人壽連踩2紅線!利率決策、契撤疏失共挨罰180萬
連3度配0.04元!外資8月買近6萬張00940 錢撒向0056、00919等「6檔高股息ETF」