發布時間:2023/11/18 16:15
圖文/CTWANT
隨著生成式聊天機器人CahtGPT在全球的爆火,AI機器人可以說是開始逐步進入人們的日常生活中,不少人都會開始使用AI機器人來輔助自己的工作。但現在就有公司發明檢測AI,專門針對各家廠商的AI機器人進行內容「正確性」上的檢測,並且將各家機器人「幻覺度」進行排名,其中冠軍就是大家所熟知的ChatGPT,而排名最末的竟然是Google所推出的PalM 2。
根據《toms hardware》報導指出,先前就有第三方研究機構在研究各家AI機器人之後,確定了AI機器人會有「幻覺(hallucinations)」的產生,AI機器人會憑空編造一些不存在的資訊來回答。
廣告 更多內容請繼續往下閱讀
先前其實就有傳出類似的案例,美國紐約律師事務所「Levidow, Levidow & Oberman」施瓦茨(Steven A Schwartz)就在一次訴訟中,提出由ChatGPT所撰寫的文件,而其中引用了6起步存在的案件當作判例,結果遭到對手公司法律團隊識破,更被法院要求解釋。
而且根據研究人員的研究,他們發現短時間內似乎無法解決AI機器人產生幻覺的問題。研究AI科技的布朗大學教授文卡達蘇巴馬尼安(Suresh Venkatasubramanian)也表示,與其說AI機器人會虛構不存在的事情,還不如說,AI機器人所產生的回答比較像是小孩子隨口說出的故事,因為不懂得事情的真偽。
廣告 更多內容請繼續往下閱讀
為了釐清AI幻覺度的問題,新創公司Vectara就進行了一項研究,以各家廠商推出的AI機器人進行法律方面的測試,Vectara提供了800多份文件給AI,接著要求這些AI依照要求來進行文件的內容摘要,最後將AI生成的結果輸入到自己研發的檢測AI中。
其中,GTP 4與GTP 4 Turbo的正確性為97%、幻覺度3%;GPT 3.5 Turbo的正確性為96.5%、幻覺度3.5%;Meta推出的Llama 2 70B正確性為94.9%、幻覺度5.1%;Llama 2 7B正確性為94.4%、幻覺度5.6%。其餘各家的AI機器人正確度均有90%以上,幻覺率也是10%以下。
但在其中,Google所推出的PalM 2,其正確率為87.9%,幻覺率為12.1%;而PalM 2 Chat的正確率為72.8%,幻覺率為27.2%。
9位中國媒體記者參加雙城論壇受阻! 國民黨痛批「破壞新聞自由」丟盡台灣人的臉
自營商又轉為倒貨!三大法人賣超103.3億元 網:投信看到一片綠該怎麼辦
跟台塑四寶說掰掰!他全數拋售All in「這檔高息ETF」 網細看狠嘲:賣垃圾買垃圾幹嘛
全民狠盯尹錫悅!明二度彈劾表決「韓人寒冬集會」備物資 免費咖啡、寶寶巴士全都有
台灣奇才左投!林昱珉控球出色「勤練新武器」 美媒揭登大聯盟時機
提早布局?00919配0.72元「最後買進日」迫近 今爆逾8萬張成交量
中山美穗重逢「10年沒見的兒子」!妹妹揭遺照華麗時刻:是我引以為傲的姊姊
台積電收紅也撐不住!台股震盪疲軟收跌26.32點 電纜、塑膠族群下挫最慘
邱泰源稱衛福部調查報告很用心 張啓楷喊「不能交差了事」整個執政團隊歪風都要重整
原民會組織法三讀!主委改山地、平地輪流當 原民會批「強迫複製殖民遺緒」擬提覆議或釋憲
J.Sheon自爆過動症!注意力難集中 掉手機、忘護照成日常
聯電爆量連4跌…殺量11萬張股價快見3字頭 分析師曝明年恐有更壞走向
《運動產業條例》三讀通過! 30年棒球迷洪孟楷:給周思齊最好的退休禮物
國民飲料回鍋助攻!「大飲帶量漲停」開紅花 華冠再遇滑鐵盧慘跌2根
失守80元大關!「它」股價閃崩奪成交額季軍 網嘲:剩什麼線沒破?
雙城論壇否決上海台辦主任、中媒來台 陸委會說話了
幕後/雙城論壇10人未過審核蔣萬安不滿 涉外人士批評:軟土深掘
張清芳出道40年沒被忘記!認「很資深」 兒子送驚喜很自豪
BBU概念股強勢回歸?新盛力帶頭領漲 1檔喜獲「巨型韭菜」加碼
最新民調再創低點!尹錫悅支持率僅剩11% 7成5南韓民眾贊成彈劾