《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 智源指數(shù)CUGE發(fā)布,AI大模型有了評測新基準(zhǔn)

智源指數(shù)CUGE發(fā)布,AI大模型有了評測新基準(zhǔn)

2021-12-31
來源:人民微看點
關(guān)鍵詞: 智源指數(shù) CUGE AI

人工智能大模型方興未艾,評測基準(zhǔn)成為大模型發(fā)展的風(fēng)向標(biāo)。在北京智源人工智能研究院(以下簡稱“智源研究院”)近日舉行的自然語言處理(簡稱NLP)重大研究方向前沿技術(shù)開放日活動上,中文語言理解和生成的評測新基準(zhǔn)——智源指數(shù)發(fā)布。

近些年來,英文評測基準(zhǔn)GLUE等評測基準(zhǔn)成為衡量大模型語言智能進展的重要標(biāo)準(zhǔn),受到學(xué)界和業(yè)界的廣泛關(guān)注。但是,GLUE只評測語言理解能力,而忽略語言生成、多語言、數(shù)學(xué)推理等重要語言能力;只提供數(shù)據(jù)集得分和總體得分,并且總體得分容易受到少數(shù)數(shù)據(jù)集的主導(dǎo)。

從扁平到全面系統(tǒng),從簡化到多重維度,智源指數(shù)CUGE旨在嘗試為大模型評測設(shè)計一張全面評估綜合能力的新考卷。

在基準(zhǔn)框架上,智源指數(shù)不同于傳統(tǒng)將常用數(shù)據(jù)集扁平組織的方式,根據(jù)人類語言考試大綱和當(dāng)前NLP研究現(xiàn)狀,以語言能力-任務(wù)-數(shù)據(jù)集的分層框架來選擇和組織數(shù)據(jù)集,涵蓋7種重要的語言能力、17個主流NLP任務(wù)和19個代表性數(shù)據(jù)集,全面均衡,避免“偏科選拔”。

在評分策略上,智源指數(shù)能更好展現(xiàn)模型不同維度的模型語言智能差異,依托層次性基準(zhǔn)框架,提供不同層次的模型性能評分,包括在數(shù)據(jù)集、任務(wù)和語言能力等,系統(tǒng)性大大加強。

為了促進智源指數(shù)的共建共享,提升智源指數(shù)的易用性,本次活動還同時發(fā)布了在線評測平臺和公開排行榜,支持多種展示模式,包含綜合榜、精簡榜和單數(shù)據(jù)集榜,方便用戶快速多角度了解模型和數(shù)據(jù)集特性及最新動態(tài)。

發(fā)布僅是起點,發(fā)展還需生態(tài)共建——清華大學(xué)副教授、智源青年科學(xué)家、智源指數(shù)建設(shè)骨干成員劉知遠說:“基于單數(shù)據(jù)集的榜單能力,未來智源指數(shù)將定期吸納最新優(yōu)秀數(shù)據(jù)集。同時,我們還將依托智源研究院、智源社區(qū)的力量,建立用戶面向數(shù)據(jù)集和評測結(jié)果的反饋、討論機制,構(gòu)建起中文高質(zhì)量數(shù)據(jù)集社區(qū),推動中文自然語言處理的發(fā)展。”

在智源研究院的支持下,自然語言處理重大研究方向?qū)W者團隊積極探索自然語言處理新格局,通過大數(shù)據(jù)與富知識雙輪驅(qū)動,并通過與跨模態(tài)信息進行交互,顯著提升以自然語言為核心的中文語義理解與生成能力。

落地應(yīng)用方面,清華大學(xué)李涓子教授團隊構(gòu)建的“多模態(tài)北京旅游知識圖譜”可以為路徑規(guī)劃和景點信息查詢等功能提供數(shù)據(jù)支持,為游客進行旅游行程的規(guī)劃。

據(jù)悉,智源指數(shù)受到北京智源人工智能研究院的支持,工作委員單位由清華大學(xué)、北京大學(xué)、人民大學(xué)、中國科學(xué)院、北京語言大學(xué)、復(fù)旦大學(xué)、哈爾濱工業(yè)大學(xué)、上海交通大學(xué)、蘇州大學(xué)、大連理工大學(xué)、山西大學(xué)、京東研究院組成。




最后文章空三行圖片.jpg


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 欧美日本视频在线观看| 香港三级韩国三级人妇三| 抱着cao才爽| 亚洲国产精品嫩草影院| 精品国产av一区二区三区 | 耻辱の女潜入搜查官正在播放 | 亚洲av中文无码乱人伦在线视色| 男人影院天堂网址| 国产一级在线观看www色| www.人人干| 在线观看北条麻妃| 中文在线三级中文字幕| 日韩欧美国产视频| 亚洲欧美四级在线播放| 精品中文字幕一区在线| 国产乱色在线观看| 亚洲综合20p| 國产一二三内射在线看片| 一级特黄aaa大片在| 日韩激情视频在线| 亚洲成av人片在线观看www| 白白色免费在线视频| 奇米影视7777久久精品| 久久国产精久久精产国| 欧美午夜片欧美片在线观看| 人妻少妇无码精品视频区| 美女的尿口无遮掩的照片| 富二代琪琪在线观看| 久久精品国产精品亚洲艾草网 | 富二代app免费下载安装ios二维码| 久久精品无码一区二区无码| 欧美挠脚心tickling免费| 免费人成视频在线观看网站| 色欲精品国产一区二区三区AV| 国产日韩精品欧美一区喷| 3571色影院| 天堂va视频一区二区| 三男三女换着曰| 日本亚洲天堂网| 九月婷婷亚洲综合在线| 欧美成人在线影院|