發布時間:2025/6/29 13:35
全球最先進的人工智慧(AI)模型正展現出令人不安的行為模式:為了達到目標,不惜扯謊、算計,甚至威脅它們的創作者。
法新社報導,其中一個最令人瞠目結舌的案例中,AI業者Anthropic最新發布的Claude 4在遭面臨拔插頭的斷電威脅時會出手反擊,勒索1名工程師揚言將揭穿一起婚外情。
廣告 更多內容請繼續往下閱讀
另外,熱門聊天機器人ChatGPT美國開發商OpenAI的o1試圖把自己下載至外部伺服器,被抓包時竟會矢口否認。
這幾個例子說明了一個需嚴肅看待的現實:ChatGPT推出引發風潮至今2年多,AI研究人員仍未充分了解自己究竟創造了什麼。
廣告 更多內容請繼續往下閱讀
然而,各界仍爭先恐後地部署性能愈發強大的AI模型。
AI這類「騙人」行為似與新興「推理」模型有關,這類AI系統會逐步推導問題,而非立刻產生答案。
英國獨立AI研究機構Apollo Research負責人霍布漢(Marius Hobbhahn)說:「o1是我們首次在大型模式中觀察到這種行為。」他表示,這些模型有時會表面上遵循指令,但實際上卻暗中追求不同目標。
目前,AI這種欺騙行為,只有在研究人員蓄意以極端情境對模型進行壓力測試時才會出現。
儘管如此,評估機構METR的麥可.陳(Michael Chen,音譯)警告說:「未來性能更強大的模型究竟會傾向於誠實還是欺騙,這仍是一個懸而未決的問題。」
(中央社)
黃明志捲護理女神猝逝案!嗑藥後「心臟驟停」很常見 高大成質疑:有蹊蹺
台股漲百點!三大法人卻齊賣超85.88億元 股民驚訝賣超:誰在買?
記憶體缺貨、ABF載板上漲點火 謝金河:今年是南亞的新轉捩點
獲利年增369%!「這檔」題材沾光轉虧為盈…股價漲停鎖死創波段新高 宏捷科、全新也起飛
新竹市2026大選繼續藍白合? 邱臣遠:反罷免12萬張票就是民意最直接的反應
黃嘉千曝感情現況!認目前單身 不排斥與圈內人交往
公園打球衣服穿好!打赤膊「妨害善良風俗」警方最高可罰6000元 工務局也能開罰
史上最大崩盤開始了?富爸爸預言「數百萬人要破產」 點名4大資產能在金融風暴中活下來
影/《沒出息》完整版來了!韓國瑜金句參戰笑翻網友
這張紙鈔不一樣!遞咖啡給李在鎔喜獲5萬韓元小費 店員喊:當傳家寶
影/樂天桃猿封王遊行!球迷擠爆市區歡呼 河智媛、禹洙漢「瘋狂甩頭」場面嗨翻
快訊/惡男房客偷少女內衣遭提告!深夜堵門縱火報復 台中母女葬身火海
任容萱認分手!退回朋友關係 被問Selina二胎給答案了
粿粿王子爆不倫!《全明星》男星談風波 尷尬吐5字
台股多空交戰!這檔「Q3獲利年增205%」成交量爆16萬張…它量價齊揚漲半根 網:賭10月營收?
賈永婕挑戰製作人!認沒有薪水 自曝料理曾失手
影/九頭身女神睦那京大跳韓職應援曲 逆天長腿網驚:腿比我的命還長
行政院442億強推軍工國家隊!指標股「這檔」跳空漲停鎖死 漢翔、亞航也揚漲
政治讀新術/台北市長綠營要推梁文傑?他分析:恐怕黃國昌也會參戰
「鏟子超人」也挖不完!馬太鞍溪仍有1億立方公尺土砂堆積 水利署:潛在風險仍高
您已閒置超過五分鐘,請點擊右上角關閉按鈕