發布時間:2023/11/18 16:15
圖文/CTWANT
隨著生成式聊天機器人CahtGPT在全球的爆火,AI機器人可以說是開始逐步進入人們的日常生活中,不少人都會開始使用AI機器人來輔助自己的工作。但現在就有公司發明檢測AI,專門針對各家廠商的AI機器人進行內容「正確性」上的檢測,並且將各家機器人「幻覺度」進行排名,其中冠軍就是大家所熟知的ChatGPT,而排名最末的竟然是Google所推出的PalM 2。
根據《toms hardware》報導指出,先前就有第三方研究機構在研究各家AI機器人之後,確定了AI機器人會有「幻覺(hallucinations)」的產生,AI機器人會憑空編造一些不存在的資訊來回答。
廣告 更多內容請繼續往下閱讀
先前其實就有傳出類似的案例,美國紐約律師事務所「Levidow, Levidow & Oberman」施瓦茨(Steven A Schwartz)就在一次訴訟中,提出由ChatGPT所撰寫的文件,而其中引用了6起步存在的案件當作判例,結果遭到對手公司法律團隊識破,更被法院要求解釋。
而且根據研究人員的研究,他們發現短時間內似乎無法解決AI機器人產生幻覺的問題。研究AI科技的布朗大學教授文卡達蘇巴馬尼安(Suresh Venkatasubramanian)也表示,與其說AI機器人會虛構不存在的事情,還不如說,AI機器人所產生的回答比較像是小孩子隨口說出的故事,因為不懂得事情的真偽。
廣告 更多內容請繼續往下閱讀
為了釐清AI幻覺度的問題,新創公司Vectara就進行了一項研究,以各家廠商推出的AI機器人進行法律方面的測試,Vectara提供了800多份文件給AI,接著要求這些AI依照要求來進行文件的內容摘要,最後將AI生成的結果輸入到自己研發的檢測AI中。
其中,GTP 4與GTP 4 Turbo的正確性為97%、幻覺度3%;GPT 3.5 Turbo的正確性為96.5%、幻覺度3.5%;Meta推出的Llama 2 70B正確性為94.9%、幻覺度5.1%;Llama 2 7B正確性為94.4%、幻覺度5.6%。其餘各家的AI機器人正確度均有90%以上,幻覺率也是10%以下。
但在其中,Google所推出的PalM 2,其正確率為87.9%,幻覺率為12.1%;而PalM 2 Chat的正確率為72.8%,幻覺率為27.2%。
傳獨吃蘋果3大單!這「觸控模組大廠」營運拚谷底翻身 分析師大讚:最壞的情況已經過去
推全球首款Micro LED智慧錶!這「面板大廠」止步4連跌翻紅 國家隊不買賬提款走人
攜手加百裕!這「TPMS大廠」卡位首例BBU美國製造 前8月營收創新高
載板漲不停!自營商卻不買帳爆砍這「CCL大廠」提款近億元 連4賣
DRAM題材熱!這「大廠」8月營收強勁飆141%助爆量上揚
時尚傳奇殞落!義大利設計大師喬治亞曼尼辭世 享耆壽91歲
PCB、玻纖布現買現套?「這檔」盤中下殺跌停…連6跌幅達25.68%慘淪弱勢股王 「它」股價也跳水
AI眼鏡利多出盡?三大法人同步倒貨...重砍這「電子大廠」1.7萬張 提款13億元離場
賴清德指示運用AI提升全民身體活動監測!編100億建構智慧醫療
龔明鑫上任先探望受衝擊產業 謝金河肯定:當前經濟部最需阿信型部長
三立副總兒稱曾交往!江祖平反嗆自戀型人格障礙 怒控「捶壞我房門」:不如一起去驗傷
牽手輝達超級晶片!這「電腦大廠」開盤飆上漲停 外資仍砍單不手軟...中鋼、宏達電都變提款機
大摩預測再漲5%?三大法人猛砸18億續買鴻海第4日 再投8.8億敲進聯電破萬張
買最多不是年增141%的南亞科!外資狂寵「這檔記憶體」搶破1.5萬張 網嗨:明天突破
快訊/江祖平急發「不自殺聲明」!喊話給過機會了:地檢署我一定會去
軍工題材點火無人機!世紀*猛拉2根攜手2檔奔漲停 「這檔」8月營收年月雙增卻重摔破6%
捲性侵疑雲!三立副總兒發聲認「跟江祖平曾交往10個月」 喊冤:不實指控
跟大哥對做會贏嗎?投信爆砍「這檔」狂殺1.85億…PCB「它」4天跌11% 網哀:帶量逃跑
iPhone「自動報案」救人命! 美少女車禍昏迷「與調度員通話22分鐘」獲救
8月營收破200億!「這檔」全年展望樂觀 22、28奈米市占看增