發布時間:2025/6/29 13:35
全球最先進的人工智慧(AI)模型正展現出令人不安的行為模式:為了達到目標,不惜扯謊、算計,甚至威脅它們的創作者。
法新社報導,其中一個最令人瞠目結舌的案例中,AI業者Anthropic最新發布的Claude 4在遭面臨拔插頭的斷電威脅時會出手反擊,勒索1名工程師揚言將揭穿一起婚外情。
廣告 更多內容請繼續往下閱讀
另外,熱門聊天機器人ChatGPT美國開發商OpenAI的o1試圖把自己下載至外部伺服器,被抓包時竟會矢口否認。
這幾個例子說明了一個需嚴肅看待的現實:ChatGPT推出引發風潮至今2年多,AI研究人員仍未充分了解自己究竟創造了什麼。
廣告 更多內容請繼續往下閱讀
然而,各界仍爭先恐後地部署性能愈發強大的AI模型。
AI這類「騙人」行為似與新興「推理」模型有關,這類AI系統會逐步推導問題,而非立刻產生答案。
英國獨立AI研究機構Apollo Research負責人霍布漢(Marius Hobbhahn)說:「o1是我們首次在大型模式中觀察到這種行為。」他表示,這些模型有時會表面上遵循指令,但實際上卻暗中追求不同目標。
目前,AI這種欺騙行為,只有在研究人員蓄意以極端情境對模型進行壓力測試時才會出現。
儘管如此,評估機構METR的麥可.陳(Michael Chen,音譯)警告說:「未來性能更強大的模型究竟會傾向於誠實還是欺騙,這仍是一個懸而未決的問題。」
(中央社)
6.9萬股民果斷出場!00940回不到發行價 主力休市前救援猛買45.3萬張
衝刺樓宇自動化!「電源管理巨頭」砸6.7億併德國大廠
警消搜索4日找到了!台中男獨攀八仙山失聯 摔落碎石坡「空拍機確認罹難」
槓龜終結!1.8億大樂透一注獨得 獎落高雄「這區」
陳妍希離婚後首個春節!牽兒現身機場「獨自返台過年」被讚爆 母子分兩路畫面曝光
2025天災回顧/西北太平洋生成27個颱風!樺加沙無情肆虐花蓮光復鄉 丹娜絲、鳳凰登陸台灣
連4槓有望終結?大樂透上看1.8億元 春節大小紅包一齊開獎
記憶體、面板遭主力猛殺!華邦電、力積電挨刀深 群創最慘被砍28.1萬張
把握最後好天氣!除夕變天轉溼涼「北部降溫最有感」 10縣市恐迎雨彈
主力狂掃21.2萬張!這檔「1月賺56億」外資也卡位 旺宏封關漲停被囤貨13.9萬張
張鈞甯首登春晚熱淚盈眶!與侯佩岑攜手亮相:內心澎湃到想哭
春節大掃除清出「小金庫」?2026二手精品市場看漲 「舊換新」成精明理財術
一旦攻擊伊朗將持續數週!傳美軍正積極備戰 福特號航艦開赴波灣增援
以關心之名!過年最怕被問工作感情 4個小妙招輕鬆應對
宜蘭姊弟遭包裹炸傷濺血!警證實內含火藥「疑計畫性犯案」 鄰居曝:見2陌生人多次場勘
首次自己過年!他曝受邀圍爐但沒有勇氣去 上網發問引網共鳴
國艦國造新進展!「造船龍頭」承攬遠洋巡護船第3艘開工 股價上漲破3%封關
美牛大開放? 食藥署列禁令:6大部位一律不得進口
影/地瓜葉不是地瓜的葉! 他讓貓狗試吃測評「超兩極反應」笑翻網友
《星光》曾靜玟操刀!男星穿塑身衣、染金髮挑戰唱跳 為演出積極瘦身
您已閒置超過五分鐘,請點擊右上角關閉按鈕