發布時間:2023/11/18 16:15
圖文/CTWANT
隨著生成式聊天機器人CahtGPT在全球的爆火,AI機器人可以說是開始逐步進入人們的日常生活中,不少人都會開始使用AI機器人來輔助自己的工作。但現在就有公司發明檢測AI,專門針對各家廠商的AI機器人進行內容「正確性」上的檢測,並且將各家機器人「幻覺度」進行排名,其中冠軍就是大家所熟知的ChatGPT,而排名最末的竟然是Google所推出的PalM 2。
根據《toms hardware》報導指出,先前就有第三方研究機構在研究各家AI機器人之後,確定了AI機器人會有「幻覺(hallucinations)」的產生,AI機器人會憑空編造一些不存在的資訊來回答。
廣告 更多內容請繼續往下閱讀
先前其實就有傳出類似的案例,美國紐約律師事務所「Levidow, Levidow & Oberman」施瓦茨(Steven A Schwartz)就在一次訴訟中,提出由ChatGPT所撰寫的文件,而其中引用了6起步存在的案件當作判例,結果遭到對手公司法律團隊識破,更被法院要求解釋。
而且根據研究人員的研究,他們發現短時間內似乎無法解決AI機器人產生幻覺的問題。研究AI科技的布朗大學教授文卡達蘇巴馬尼安(Suresh Venkatasubramanian)也表示,與其說AI機器人會虛構不存在的事情,還不如說,AI機器人所產生的回答比較像是小孩子隨口說出的故事,因為不懂得事情的真偽。
廣告 更多內容請繼續往下閱讀
為了釐清AI幻覺度的問題,新創公司Vectara就進行了一項研究,以各家廠商推出的AI機器人進行法律方面的測試,Vectara提供了800多份文件給AI,接著要求這些AI依照要求來進行文件的內容摘要,最後將AI生成的結果輸入到自己研發的檢測AI中。
其中,GTP 4與GTP 4 Turbo的正確性為97%、幻覺度3%;GPT 3.5 Turbo的正確性為96.5%、幻覺度3.5%;Meta推出的Llama 2 70B正確性為94.9%、幻覺度5.1%;Llama 2 7B正確性為94.4%、幻覺度5.6%。其餘各家的AI機器人正確度均有90%以上,幻覺率也是10%以下。
但在其中,Google所推出的PalM 2,其正確率為87.9%,幻覺率為12.1%;而PalM 2 Chat的正確率為72.8%,幻覺率為27.2%。
6.9萬股民果斷出場!00940回不到發行價 主力休市前救援猛買45.3萬張
衝刺樓宇自動化!「電源管理巨頭」砸6.7億併德國大廠
警消搜索4日找到了!台中男獨攀八仙山失聯 摔落碎石坡「空拍機確認罹難」
槓龜終結!1.8億大樂透一注獨得 獎落高雄「這區」
陳妍希離婚後首個春節!牽兒現身機場「獨自返台過年」被讚爆 母子分兩路畫面曝光
2025天災回顧/西北太平洋生成27個颱風!樺加沙無情肆虐花蓮光復鄉 丹娜絲、鳳凰登陸台灣
連4槓有望終結?大樂透上看1.8億元 春節大小紅包一齊開獎
記憶體、面板遭主力猛殺!華邦電、力積電挨刀深 群創最慘被砍28.1萬張
把握最後好天氣!除夕變天轉溼涼「北部降溫最有感」 10縣市恐迎雨彈
主力狂掃21.2萬張!這檔「1月賺56億」外資也卡位 旺宏封關漲停被囤貨13.9萬張
張鈞甯首登春晚熱淚盈眶!與侯佩岑攜手亮相:內心澎湃到想哭
春節大掃除清出「小金庫」?2026二手精品市場看漲 「舊換新」成精明理財術
一旦攻擊伊朗將持續數週!傳美軍正積極備戰 福特號航艦開赴波灣增援
以關心之名!過年最怕被問工作感情 4個小妙招輕鬆應對
宜蘭姊弟遭包裹炸傷濺血!警證實內含火藥「疑計畫性犯案」 鄰居曝:見2陌生人多次場勘
首次自己過年!他曝受邀圍爐但沒有勇氣去 上網發問引網共鳴
國艦國造新進展!「造船龍頭」承攬遠洋巡護船第3艘開工 股價上漲破3%封關
美牛大開放? 食藥署列禁令:6大部位一律不得進口
影/地瓜葉不是地瓜的葉! 他讓貓狗試吃測評「超兩極反應」笑翻網友
《星光》曾靜玟操刀!男星穿塑身衣、染金髮挑戰唱跳 為演出積極瘦身
您已閒置超過五分鐘,請點擊右上角關閉按鈕