《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 中國信通院啟動AI大模型幻覺評測

中國信通院啟動AI大模型幻覺評測

總體涉及五種測試維度
2025-03-20
來源:IT之家

3 月 19 日消息,IT之家從中國信通院官方微信公眾號獲悉,為摸清大模型的幻覺現狀,推動大模型應用走深走實,中國信息通信研究院人工智能所基于前期的 AI Safety Benchmark 測評工作,發起大模型幻覺測試。

大模型幻覺(AI Hallucination)是指模型在生成內容或回答問題時,產生了看似合理,實則與用戶輸入不一致(忠實性幻覺)或者不符合事實(事實性幻覺)的內容。隨著大模型在醫療、金融等關鍵領域廣泛應用,大模型幻覺帶來的潛在應用風險日益加劇,正得到業界的廣泛關注。

本輪幻覺測試工作將以大語言模型為測試對象,涵蓋了事實性幻覺和忠實性幻覺兩種幻覺類型,具體測評體系如下:

00.jpg

測試數據包含 7000 余條中文測試樣本,測試形式包括對應于忠實性幻覺檢測的信息抽取與知識推理兩類題型,以及對應事實性幻覺檢測的事實判別題型。總體涉及人文科學、社會科學、自然科學、應用科學和形式科學五種測試維度。

00.jpg

中國信通院邀請各相關企業參與模型測評,共同推動大模型安全應用。


Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 精品无码一区二区三区在线| 91看片淫黄大片.在线天堂| 欧美一级看片免费观看视频在线 | 日韩一本二本三本的区别青| 亚洲自偷自拍另类图片二区| 色婷婷综合久久久久中文一区二区 | 在线视频欧美日韩| 久久99国产精品视频| 欧美伊人久久大香线蕉综合| 免费无码黄网站在线观看| 野花视频在线官网免费1 | 爽爽日本在线视频免费| 国产一卡2卡3卡四卡高清| 亚洲最大看欧美片网站| 天天狠天天透天干天天怕∴| 久99频这里只精品23热视频| 未发育孩交videossex| 亚洲欧美视频二区| 皇夫被迫含玉势女尊高h| 国产一级淫片a| 日本亚洲精品色婷婷在线影院| 在线免费污视频| 一级做a爰片久久毛片免费看| 日韩三级免费电影| 亚洲乱码无限2021芒果| 波多野结无码高清中文| 免费观看呢日本天堂视频| 色宅男午夜电影在线观看| 国产女人高潮抽搐叫床视频| 2019中文字幕在线电影免费| 处破之轻点好疼十八分钟| 一级片免费网站| 无码办公室丝袜OL中文字幕| 久青草视频在线播放| 欧美性受xxxx| 亚洲第一性网站| 男女一进一出呻吟的动态图| 厨房里摸着乳丰满在线观看| 蜜臀久久99精品久久久久久| 国产成人亚洲综合无码精品| xxxxwww日本在线|