發布時間:2023/11/18 16:15
圖文/CTWANT
隨著生成式聊天機器人CahtGPT在全球的爆火,AI機器人可以說是開始逐步進入人們的日常生活中,不少人都會開始使用AI機器人來輔助自己的工作。但現在就有公司發明檢測AI,專門針對各家廠商的AI機器人進行內容「正確性」上的檢測,並且將各家機器人「幻覺度」進行排名,其中冠軍就是大家所熟知的ChatGPT,而排名最末的竟然是Google所推出的PalM 2。
根據《toms hardware》報導指出,先前就有第三方研究機構在研究各家AI機器人之後,確定了AI機器人會有「幻覺(hallucinations)」的產生,AI機器人會憑空編造一些不存在的資訊來回答。
廣告 更多內容請繼續往下閱讀
先前其實就有傳出類似的案例,美國紐約律師事務所「Levidow, Levidow & Oberman」施瓦茨(Steven A Schwartz)就在一次訴訟中,提出由ChatGPT所撰寫的文件,而其中引用了6起步存在的案件當作判例,結果遭到對手公司法律團隊識破,更被法院要求解釋。
而且根據研究人員的研究,他們發現短時間內似乎無法解決AI機器人產生幻覺的問題。研究AI科技的布朗大學教授文卡達蘇巴馬尼安(Suresh Venkatasubramanian)也表示,與其說AI機器人會虛構不存在的事情,還不如說,AI機器人所產生的回答比較像是小孩子隨口說出的故事,因為不懂得事情的真偽。
廣告 更多內容請繼續往下閱讀
為了釐清AI幻覺度的問題,新創公司Vectara就進行了一項研究,以各家廠商推出的AI機器人進行法律方面的測試,Vectara提供了800多份文件給AI,接著要求這些AI依照要求來進行文件的內容摘要,最後將AI生成的結果輸入到自己研發的檢測AI中。
其中,GTP 4與GTP 4 Turbo的正確性為97%、幻覺度3%;GPT 3.5 Turbo的正確性為96.5%、幻覺度3.5%;Meta推出的Llama 2 70B正確性為94.9%、幻覺度5.1%;Llama 2 7B正確性為94.4%、幻覺度5.6%。其餘各家的AI機器人正確度均有90%以上,幻覺率也是10%以下。
但在其中,Google所推出的PalM 2,其正確率為87.9%,幻覺率為12.1%;而PalM 2 Chat的正確率為72.8%,幻覺率為27.2%。
黃明志被捕大頭照曝光!身上搜出9顆藍藥丸 涉持毒吸毒遭起訴「12/18開庭」
「這檔」記憶體股勁揚破4%!自營商卻倒上千張 台積電也遭出貨
美股創新高!5大海外主題ETF下半年超火熱 這檔股民跳增2萬人最搶手
降息風當道!這檔主動式ETF配息逆勢創高「每股0.334元」 11/17最後上車日
輝達市值破5兆美元!黃仁勳讚台積電、鴻海等4台廠 助攻美國AI晶片生產
天天都是甜甜價?「這檔」9月營收年減0.14%...股價連6黑登弱勢股王 碳化矽「它們」也入列
AI即將取代一切!馬斯克大膽預言5年內「手機、App全消失」
信義豪宅雙屍案新進展!創投CEO死前狂嗑毒 與女藥頭「互惠關係」曝光
三大法人倒「這檔」面板股破4萬張!股價慘連5跌 力積電也遭上萬張出貨
信義豪宅雙屍案手機破解!9億創投CEO生前狂買逾7種毒品 3藥頭落網
第三季獲利優於市場預期!三大法人看好「這檔」狂買2.7萬張 外資、自營商齊買漲半根的「它」
沒事別亂碰!旅客誤按北捷「緊急斷電鈕」害列車停駛 挨罰1萬元
中工遭寶佳「禿鷹式」突襲!逾1成股權被吃下 聲明斥:有心人士覬覦經營權
股價被打回原點?外資狠砍「這檔」3.8萬張回收12億…「它」連吞2根跌停也被下殺 網哀:新韭菜進場
馬上就要退休!「陳水扁案」主審法官周盈文腦出血命危 急送台大醫搶救
IC設計股兩樣情!「這2檔」股價強勢飆出漲停 晶焱卻慘跌停達連2跌
觀察/從北農總經理到年薪1500萬的台肥董事長 吳音寧回來了
紐約市長選戰倒數!歐巴馬熱線挺「穆斯林新星」 川普怒批「共產黨員」:當選就扣留聯邦補助金
快訊/王子偷吃禁「粿」慘了! 公司出面道歉:停止所有演藝活動
矽光子紅花遍地開!這IC封測廠「獲利季增139%」強拉漲停 立碁轉弱下殺半根
您已閒置超過五分鐘,請點擊右上角關閉按鈕