發布時間:2025/6/29 13:35
全球最先進的人工智慧(AI)模型正展現出令人不安的行為模式:為了達到目標,不惜扯謊、算計,甚至威脅它們的創作者。
法新社報導,其中一個最令人瞠目結舌的案例中,AI業者Anthropic最新發布的Claude 4在遭面臨拔插頭的斷電威脅時會出手反擊,勒索1名工程師揚言將揭穿一起婚外情。
廣告 更多內容請繼續往下閱讀
另外,熱門聊天機器人ChatGPT美國開發商OpenAI的o1試圖把自己下載至外部伺服器,被抓包時竟會矢口否認。
這幾個例子說明了一個需嚴肅看待的現實:ChatGPT推出引發風潮至今2年多,AI研究人員仍未充分了解自己究竟創造了什麼。
廣告 更多內容請繼續往下閱讀
然而,各界仍爭先恐後地部署性能愈發強大的AI模型。
AI這類「騙人」行為似與新興「推理」模型有關,這類AI系統會逐步推導問題,而非立刻產生答案。
英國獨立AI研究機構Apollo Research負責人霍布漢(Marius Hobbhahn)說:「o1是我們首次在大型模式中觀察到這種行為。」他表示,這些模型有時會表面上遵循指令,但實際上卻暗中追求不同目標。
目前,AI這種欺騙行為,只有在研究人員蓄意以極端情境對模型進行壓力測試時才會出現。
儘管如此,評估機構METR的麥可.陳(Michael Chen,音譯)警告說:「未來性能更強大的模型究竟會傾向於誠實還是欺騙,這仍是一個懸而未決的問題。」
(中央社)
台積電ADR飆新高!專家看好現股「隨時創天價」 台股還差臨門一腳
廣達配息13元「殖利率逾5%」!國家隊砸10億元搶搭除息列車 「這檔」盤中股價「創今年新高」也被買爆
Dcard發「租屋勸退文」被告!台中男大生遭物業公司求償5萬 法院判決出爐
陳傑憲再下一城!中職上半季冠軍出爐 統一獅客隊一片橘
青鳥強制逼問拍自強隧道女遊客是五迷到歌詞景點朝聖 張啓楷籲勿傷害台灣觀光經濟
00940韭到有剩?「年化超5%」國家隊不要了狂扔5千張 本次配息0.04元…網心冷:還是買不起50嵐
鰻魚飯名店「肥前屋」今歇業!老台北人湧現告別潮:回憶收起來了
DDR4飆漲加美光財報樂觀!南亞科上週卻遭三大法人倒上萬張 股價慘拉回
蘋果新專利點火!首度自研CIS 台供應鏈「2檔」有望吃補
持有比率近4成!外資上週進貨「這檔」ETF破十萬張 0056換股也買上萬張
台幣升破29還沒完!媒體人揭「非升不可」內幕 年底恐見28元大關、壽險業壓力爆表
暑假找打工屢碰壁!女大生嘆「只錄取一間」 網不意外…曝短期工讀劣勢
統一獅今晚力拚季冠軍!5000條彩帶準備好了 封王慶祝「不能噴香檳」
車禍要求女大生「肉償」!檢察官不滿遭拔官提再審 法官駁回
萬人排隊等買!「這檔」搶攻「機器人關節」5天炸噴40% 大略-KY周漲46%起死回生?
賴總統自稱「憲法守護者」被批自欺欺人 柯志恩:之前他才說中華民國(憲法)是災難
川普怒轟鮑爾「石頭腦」!想用影子主席操盤利率?阮慕驊:台幣會繼續升
ATM新規!多家銀行調降提款上限 合庫銀跟進7/29起限10萬
藍委稱賴清德像極了史達林、毛澤東 許智傑說你錯了:「這個人」更像
電動車新霸主誕生?這「手機大廠」開賣3分鐘狂收20萬訂單 特斯拉、比亞迪要小心