發布時間:2023/11/18 16:15
圖文/CTWANT
隨著生成式聊天機器人CahtGPT在全球的爆火,AI機器人可以說是開始逐步進入人們的日常生活中,不少人都會開始使用AI機器人來輔助自己的工作。但現在就有公司發明檢測AI,專門針對各家廠商的AI機器人進行內容「正確性」上的檢測,並且將各家機器人「幻覺度」進行排名,其中冠軍就是大家所熟知的ChatGPT,而排名最末的竟然是Google所推出的PalM 2。
根據《toms hardware》報導指出,先前就有第三方研究機構在研究各家AI機器人之後,確定了AI機器人會有「幻覺(hallucinations)」的產生,AI機器人會憑空編造一些不存在的資訊來回答。
廣告 更多內容請繼續往下閱讀
先前其實就有傳出類似的案例,美國紐約律師事務所「Levidow, Levidow & Oberman」施瓦茨(Steven A Schwartz)就在一次訴訟中,提出由ChatGPT所撰寫的文件,而其中引用了6起步存在的案件當作判例,結果遭到對手公司法律團隊識破,更被法院要求解釋。
而且根據研究人員的研究,他們發現短時間內似乎無法解決AI機器人產生幻覺的問題。研究AI科技的布朗大學教授文卡達蘇巴馬尼安(Suresh Venkatasubramanian)也表示,與其說AI機器人會虛構不存在的事情,還不如說,AI機器人所產生的回答比較像是小孩子隨口說出的故事,因為不懂得事情的真偽。
廣告 更多內容請繼續往下閱讀
為了釐清AI幻覺度的問題,新創公司Vectara就進行了一項研究,以各家廠商推出的AI機器人進行法律方面的測試,Vectara提供了800多份文件給AI,接著要求這些AI依照要求來進行文件的內容摘要,最後將AI生成的結果輸入到自己研發的檢測AI中。
其中,GTP 4與GTP 4 Turbo的正確性為97%、幻覺度3%;GPT 3.5 Turbo的正確性為96.5%、幻覺度3.5%;Meta推出的Llama 2 70B正確性為94.9%、幻覺度5.1%;Llama 2 7B正確性為94.4%、幻覺度5.6%。其餘各家的AI機器人正確度均有90%以上,幻覺率也是10%以下。
但在其中,Google所推出的PalM 2,其正確率為87.9%,幻覺率為12.1%;而PalM 2 Chat的正確率為72.8%,幻覺率為27.2%。
矽光子綠一片!「這檔」光通訊股卻獲博通財報點火 強漲半根飆連4漲
雙城論壇前被問「是哪國的台北市長?」蔣萬安:支持符合中華民國憲法的九二共識
C羅跨界出演《玩命關頭11》!馮迪索曬夢幻同框照 點頭證實:為他寫了一個角色
攻矽光子、布局美國!聯電14天狂吸122億鉅資 「這3檔」獲三大法人齊搶3.5萬張
IC設計股勁揚!「這檔」11月營收年增593%亮燈 迅杰投資無人機連2漲停
電子權值股「2巨頭」淪提款機!外資出場台積電、鴻海達218億 華邦電最慘遭砍破10萬張
強勢進軍無人機!「IC設計廠」連3漲23.41%炸2漲停
男大生「越級駕駛」黃牌重機!自撞彎道墜一層樓高亡 勤益科大悲痛發聲
蛋雕先進擁抱成熟製程!外資搶進聯電2.5萬張...反手爆砍台積電提款173億 再捧2.4億元買台泥
「這2檔」慘遭投信大倒破萬張 聯電逆勢連2漲也遭近萬張提款
政院不副署!賴總統批示《財劃法》修法:破壞財政永續
記憶體雙雄沒力了?投信趁機砸2.47億進場力積電、華邦電 「這檔」11月獲利創佳成搶手貨
上班途中遇死劫!淡水2機車碰撞...護理師頭部重創不治 無照男辯「正要去考駕照」遭送辦
00712年化配息率飆8%!外資豪砸1.2億搶「3檔ETF」破萬張 這檔斥資2.6億連10買
SpaceX IPO助攻!「錫膏廠」爆漲停吸6千張買單排隊 Q3 EPS季增644%超搶眼
卓揆確定不副署新修財劃法 藍黨團:別把台南市長不進議會那套搬到國會
卓榮泰宣布不副署新修財劃法 藍委:未來國會通過法律都可能被拒副署、實施
記憶體雙雄強勢入列!00735換股出爐獲金像電、華通加持 再補強韓美半導體
影/蔡依林旅行最重視「吃+睡覺」 自爆:逛街最後一名
AI伺服器需求點燃!這「PCB鑽針廠」飆漲停3.1萬張買不到 錸德猛拔第4根...39檔個股開紅燈
您已閒置超過五分鐘,請點擊右上角關閉按鈕