發布時間:2023/11/18 16:15
圖文/CTWANT
隨著生成式聊天機器人CahtGPT在全球的爆火,AI機器人可以說是開始逐步進入人們的日常生活中,不少人都會開始使用AI機器人來輔助自己的工作。但現在就有公司發明檢測AI,專門針對各家廠商的AI機器人進行內容「正確性」上的檢測,並且將各家機器人「幻覺度」進行排名,其中冠軍就是大家所熟知的ChatGPT,而排名最末的竟然是Google所推出的PalM 2。
根據《toms hardware》報導指出,先前就有第三方研究機構在研究各家AI機器人之後,確定了AI機器人會有「幻覺(hallucinations)」的產生,AI機器人會憑空編造一些不存在的資訊來回答。
廣告 更多內容請繼續往下閱讀
先前其實就有傳出類似的案例,美國紐約律師事務所「Levidow, Levidow & Oberman」施瓦茨(Steven A Schwartz)就在一次訴訟中,提出由ChatGPT所撰寫的文件,而其中引用了6起步存在的案件當作判例,結果遭到對手公司法律團隊識破,更被法院要求解釋。
而且根據研究人員的研究,他們發現短時間內似乎無法解決AI機器人產生幻覺的問題。研究AI科技的布朗大學教授文卡達蘇巴馬尼安(Suresh Venkatasubramanian)也表示,與其說AI機器人會虛構不存在的事情,還不如說,AI機器人所產生的回答比較像是小孩子隨口說出的故事,因為不懂得事情的真偽。
廣告 更多內容請繼續往下閱讀
為了釐清AI幻覺度的問題,新創公司Vectara就進行了一項研究,以各家廠商推出的AI機器人進行法律方面的測試,Vectara提供了800多份文件給AI,接著要求這些AI依照要求來進行文件的內容摘要,最後將AI生成的結果輸入到自己研發的檢測AI中。
其中,GTP 4與GTP 4 Turbo的正確性為97%、幻覺度3%;GPT 3.5 Turbo的正確性為96.5%、幻覺度3.5%;Meta推出的Llama 2 70B正確性為94.9%、幻覺度5.1%;Llama 2 7B正確性為94.4%、幻覺度5.6%。其餘各家的AI機器人正確度均有90%以上,幻覺率也是10%以下。
但在其中,Google所推出的PalM 2,其正確率為87.9%,幻覺率為12.1%;而PalM 2 Chat的正確率為72.8%,幻覺率為27.2%。
SJ東海Solo登KKBOX!唱中文歌〈約定〉寵粉 鬆口認緊張:想做好舞台
週末出門記得帶傘!氣象署示警鋒面+西南風夾擊「雨彈連炸2天」 中南部慎防大雨、豪雨
目標價喊出3800元!「半導體設備廠」首季EPS賺破1股本 濕製程+特化整合奠定領導地位
中東地區終於迎來曙光!巴國總理謝里夫:美伊預計在24小時內敲定協議
看好EPS挑戰68.3元!這「網通大廠」光通訊、800G交換器需求太香 下半年營運再升溫
切三星矽電容供應鏈!「記憶體大廠」漲停累漲15.44% 外資本週敲進5萬張補血81.3億元
SpaceX收漲19%市值突破2兆美元!超車台積電成全球市值第6大企業
吳建豪舞台出狀況!華麗轉身將麥克風撞倒 抱病演出吃錯東西
搶攻供應鏈移轉商機!「這檔」5月營收年增逾3成、年月雙增 再拓歐洲市場
利多連發仍遭殺!「代工大廠」切高通供應鏈迎連2漲12.7% 投信卻連斬3週抽走1175億元
陳華昔爆粗口遭炎上!露面曝「心情有好點」 自揭努力增重防肌少症
記憶體同步被砍!自營商退貨「這3檔」1.4萬張 連賣南亞科4週帶走34.63億元
供需吃緊看到2027年後!「被動元件大廠」接單出貨比衝上1.4 擴產、調價同步啟動
曾沛慈急性咽喉炎失聲!回台親曝恢復狀況 參戰《浪姐》拚到「腹肌都出來了」
AI伺服器淪提款機!外資倒貨「這2檔」15.7萬張 連砍廣達4週捲走955億元
甲骨文訂單加持!「AI伺服器廠」目標價放眼385元 投信砸1062億元連4週掃貨28.7萬張
盧廣仲3度叩關金曲歌王!笑說「有去有機會」 認會到公園與練氣功
目標價最高上看800元!它「切入800G供應鏈」相關營收占比可達20% 車用需求也同步增溫
曾沛慈《浪姐》首奪冠!黃偉晉發聲「最好的安排」 認知道狼人殺作弊是誰
台股震盪外資狂賣!「這2檔ETF」單周被外資倒貨43萬張 0050慘被提款284億元
您已閒置超過五分鐘,請點擊右上角關閉按鈕