亚洲精品一区二区三区精品,伊人久久大香线蕉av最新午夜,亚洲乱码日产精品bd在,一本久久综合亚洲鲁鲁五月天,在线天堂新版最新版在线8

下載app

掃碼下載

掃碼關(guān)注

新華報業(yè)網(wǎng)  > 江蘇/科技 > 正文
大模型科研能力哪家強?評價參考來了

人工智能正在科研方面展現(xiàn)出巨大潛力。然而,隨著其應(yīng)用逐步加深,一些問題也浮出水面:大模型解決學科領(lǐng)域問題的效能如何?科學數(shù)據(jù)供給的質(zhì)量如何?是否有“裁判員”對大模型科研能力進行評價?

近日,由中國科學院計算機網(wǎng)絡(luò)信息中心牽頭建設(shè)的科學地平線(SciHorizon)平臺正式上線。作為國際首個聚焦“數(shù)據(jù)+模型”角度、面向人工智能驅(qū)動科學研究的綜合評價平臺,科學地平線旨在評估大模型在科研領(lǐng)域的應(yīng)用能力以及科學數(shù)據(jù)質(zhì)量,為科研人員使用大模型高效解決科學問題提供參考。

在科學地平線網(wǎng)站的大模型科學領(lǐng)域能力測試榜單中,用戶可根據(jù)不同學科瀏覽對應(yīng)大模型排名。例如,在全學科排名中,DeepSeek-R1以71.68的綜合評分暫列第一。

“考慮到一種大模型并非在所有學科領(lǐng)域都能展現(xiàn)出非凡能力,我們對學科類型進行分類,包括全學科、數(shù)學、物理學、化學、生命科學、地球與空間科學6種?!敝袊茖W院計算機網(wǎng)絡(luò)信息中心研究員祝恒書介紹,在不同學科下,依據(jù)知識、理解、推理、價值觀、多模態(tài)這5項評價指標,大模型的表現(xiàn)能力會被重新排序??蒲腥藛T能據(jù)此迅速找到適配度高且綜合能力更強的大模型輔助科學研究。

祝恒書補充說,針對大模型幻覺問題,團隊正在構(gòu)建能將科學價值觀納入評價的指標體系,推動大模型在回答科學問題時遵守科學倫理和道德規(guī)范,實現(xiàn)價值觀對齊。

高質(zhì)量數(shù)據(jù)是大模型的“成長燃料”。數(shù)據(jù)越豐富,大模型能“學到”的知識越多,能力也就越強。但是,并非所有數(shù)據(jù)都會幫助大模型不斷“成長”。只有高質(zhì)量數(shù)據(jù)能讓大模型變得更“聰明”,低質(zhì)量數(shù)據(jù)則會讓大模型“變笨”。

在科學地平線網(wǎng)站的高質(zhì)量科學數(shù)據(jù)推薦榜單頁面上,分別列出了地球科學、生命科學、材料科學領(lǐng)域排名前十的數(shù)據(jù)集。其中,在地球科學領(lǐng)域,由中國科學院青藏高原研究所等機構(gòu)發(fā)布的“中國氣象驅(qū)動數(shù)據(jù)集(1979—2018)”暫列首位。

祝恒書介紹,為確保評價體系的合理性和公平性,研究團隊共收集國內(nèi)高校、科研院所等上百家機構(gòu)發(fā)布的數(shù)據(jù)集,并從規(guī)范性、可用性、可解釋性、合規(guī)性4個維度對數(shù)據(jù)集作出評價。每一維度下,還設(shè)置了不同子指標?!巴ㄟ^考核子指標,我們可以發(fā)現(xiàn)數(shù)據(jù)是否在某一維度內(nèi)符合標準,從而對科學數(shù)據(jù)的質(zhì)量作出綜合評價?!弊:銜f。

“我們希望通過對高質(zhì)量數(shù)據(jù)特征進行深度解析,為科研人員開展科學研究提供便利?!弊:銜硎荆磥韴F隊將構(gòu)建“數(shù)據(jù)—場景—價值”的轉(zhuǎn)化閉環(huán),讓每份數(shù)據(jù)都能在產(chǎn)業(yè)升級中釋放最大動能。

不少專家預(yù)測,智能體將在科學研究中釋放巨大潛力。祝恒書介紹,團隊目前正開展面向科學領(lǐng)域的多智能體研究工作,并已在人工智能數(shù)字細胞方向取得階段性進展,未來還將部署建設(shè)相關(guān)評測系統(tǒng)。

“該系統(tǒng)將聚焦科學工具調(diào)用與環(huán)境交互能力、跨領(lǐng)域協(xié)作能力和復雜任務(wù)拆解效能等核心指標,建立從基礎(chǔ)理論驗證到產(chǎn)業(yè)轉(zhuǎn)化落地的全鏈條評測標準,為科研人員高效運用大模型開展科研攻關(guān)提供科學化、系統(tǒng)化指引?!弊:銜f。(記者 薛巖)

責編:韓震霞
版權(quán)和免責聲明

版權(quán)聲明: 凡來源為"交匯點、新華日報及其子報"或電頭為"新華報業(yè)網(wǎng)"的稿件,均為新華報業(yè)網(wǎng)獨家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"新華報業(yè)網(wǎng)",并保留"新華報業(yè)網(wǎng)"的電頭。

免責聲明: 本站轉(zhuǎn)載稿件僅代表作者個人觀點,與新華報業(yè)網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或者承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。

專題
視頻

掃碼下載

交匯點新聞APP

Android版

iPhone版

分享到微信朋友圈
打開微信,點擊底部的“發(fā)現(xiàn)”,使用 “掃一掃” 即可將網(wǎng)頁分享到我的朋友圈。
分享到QQ
手機QQ掃描二維碼,點擊右上角 ··· 按鈕分享到QQ好友或QQ空間