發布時間:2023/11/18 16:15
圖文/CTWANT
隨著生成式聊天機器人CahtGPT在全球的爆火,AI機器人可以說是開始逐步進入人們的日常生活中,不少人都會開始使用AI機器人來輔助自己的工作。但現在就有公司發明檢測AI,專門針對各家廠商的AI機器人進行內容「正確性」上的檢測,並且將各家機器人「幻覺度」進行排名,其中冠軍就是大家所熟知的ChatGPT,而排名最末的竟然是Google所推出的PalM 2。
根據《toms hardware》報導指出,先前就有第三方研究機構在研究各家AI機器人之後,確定了AI機器人會有「幻覺(hallucinations)」的產生,AI機器人會憑空編造一些不存在的資訊來回答。
廣告 更多內容請繼續往下閱讀
先前其實就有傳出類似的案例,美國紐約律師事務所「Levidow, Levidow & Oberman」施瓦茨(Steven A Schwartz)就在一次訴訟中,提出由ChatGPT所撰寫的文件,而其中引用了6起步存在的案件當作判例,結果遭到對手公司法律團隊識破,更被法院要求解釋。
而且根據研究人員的研究,他們發現短時間內似乎無法解決AI機器人產生幻覺的問題。研究AI科技的布朗大學教授文卡達蘇巴馬尼安(Suresh Venkatasubramanian)也表示,與其說AI機器人會虛構不存在的事情,還不如說,AI機器人所產生的回答比較像是小孩子隨口說出的故事,因為不懂得事情的真偽。
廣告 更多內容請繼續往下閱讀
為了釐清AI幻覺度的問題,新創公司Vectara就進行了一項研究,以各家廠商推出的AI機器人進行法律方面的測試,Vectara提供了800多份文件給AI,接著要求這些AI依照要求來進行文件的內容摘要,最後將AI生成的結果輸入到自己研發的檢測AI中。
其中,GTP 4與GTP 4 Turbo的正確性為97%、幻覺度3%;GPT 3.5 Turbo的正確性為96.5%、幻覺度3.5%;Meta推出的Llama 2 70B正確性為94.9%、幻覺度5.1%;Llama 2 7B正確性為94.4%、幻覺度5.6%。其餘各家的AI機器人正確度均有90%以上,幻覺率也是10%以下。
但在其中,Google所推出的PalM 2,其正確率為87.9%,幻覺率為12.1%;而PalM 2 Chat的正確率為72.8%,幻覺率為27.2%。
訂單滿手創新高!「半導體統包工程廠」搭擴產潮列車 全年營運看旺
BBU出貨爆發!這「電池模組廠」Q1每股賺進2.05元 獲利年增92%
宣布啟動漲價機制!自營商砸1.87億狂搶「頻率元件廠」破千張 聯電、鴻海也進掃貨清單
搶進矽光子、低軌衛星也沒用!三大法人狂砍「面板雙虎」捲破51億 再狙擊旺宏2.2萬抱回30億
美伊最壞情況已過?美股4大指數全面反彈 道瓊指數大漲逾800點
抽中就賺5450元小確幸!這「KTV餐飲集團」上市增資6千萬 破千機會開抽
原料緊缺一度猛飆108%!這「塑化廠」高點跌落...連黑4天崩挫16.6% 登弱勢股王
矽光子發威!「光通訊大廠」11天爆噴89%寫新高 今年來股價翻倍漲
雨要來了!明起「雷雨狂炸+強風夾擊」降溫轉雨 下週氣溫再進一步下降
AI伺服器需求持續強勁!「電子五哥」遭三大法人砸近60億全到齊 再掃貨台玻2.5萬張
週五賺2億好休假!大樂透今晚開獎 億萬密碼出爐
台股市值超英奪全球第7!阮慕驊憂K型經濟:不投資恐就淪低層
矽光子串12顆紅燈!華星光攻頂迎連11漲、13檔同寫新高價 旺矽勇闖5000元大關
搭漲價列車飆天價!外資反手砍倉「銅箔基板廠」入袋38億 面板雙虎各遭殺逾10萬張
目標價喊4570元!「銅箔基板廠」EPS飆83.35元 握M9優勢大吃輝達、亞馬遜AI晶片訂單
還沒漲夠!聯電通知下半年晶圓價格調整 外資連日重砸91.9億瘋掃13.5萬張
2千萬訂單到手!「無人機指標廠」正式打入國軍供應鏈 1月獲利暴漲645%
不因惡意攻擊而止步!蘇巧慧曝網軍留言路數:其實看久還蠻有趣
記憶體成箭靶?投信拋售「這指標廠」捲走16億、旺宏也中刀 仁寶淌血8天再殺1.7萬張
Q1每股賺進45.9元!「光學鏡頭大廠」目標價3200元 Q2淡季EPS估達34.8元
您已閒置超過五分鐘,請點擊右上角關閉按鈕