樱花草在线社区www中国,夜夜躁狠狠躁日日躁,在线观看播放

亚洲精品一区二区三区精品,伊人久久大香线蕉av最新午夜,亚洲乱码日产精品bd在,一本久久综合亚洲鲁鲁五月天,在线天堂新版最新版在线8

全國首次！中國AI代碼大模型基準(zhǔn)測試結(jié)果在南京發(fā)布

2025/04/15 21:54 交匯點(diǎn)新聞

近日，中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟（簡稱AIIA）第十四次全體會議暨人工智能賦能新型工業(yè)化深度行（南京站）活動在南京成功召開。會上，“方升-Coder”代碼大模型首次基準(zhǔn)測試結(jié)果重磅發(fā)布。

當(dāng)前，以大模型為代表的人工智能技術(shù)飛速發(fā)展，代碼是大模型重要能力之一，代碼大模型已成為軟件開發(fā)工程師的必備工具，如何準(zhǔn)確評估大模型的代碼能力，充分挖掘其優(yōu)勢與不足是業(yè)界持續(xù)關(guān)心的問題。AIIA于2025年正式啟動了“方升-Coder”基準(zhǔn)測試，以代碼大模型標(biāo)準(zhǔn)為依據(jù)，通過精心設(shè)計科學(xué)合理的測試任務(wù)和測試數(shù)據(jù)，實(shí)現(xiàn)對大模型的代碼能力客觀、公正且全面的評估。

此次“方升-Coder”代碼大模型基準(zhǔn)測試共涉及主流大語言模型21個，其中國內(nèi)大模型15個、國外大模型6個，測試過程圍繞代碼生成、代碼解釋、代碼注釋三個維度對國內(nèi)外大模型能力進(jìn)行詳細(xì)測試。測試結(jié)果表明，推理模型相較基礎(chǔ)模型的代碼綜合能力更優(yōu)；相關(guān)大模型代碼理解任務(wù)表現(xiàn)趨同，代碼生成任務(wù)差異顯著；大模型在代碼注釋、代碼解釋、代碼生成任務(wù)中的能力依次遞減。

下一步，南京將搶抓機(jī)遇，加入“方升”合作伙伴計劃，吸引更多大模型頭部企業(yè)來寧布局發(fā)展，支持制造、能源等領(lǐng)域企業(yè)與大模型頭部企業(yè)深度合作。同時，推動南京人工智能企業(yè)依托現(xiàn)有大模型服務(wù)能力，積極支撐參與基準(zhǔn)測試建設(shè)，為國家AI標(biāo)準(zhǔn)體系貢獻(xiàn)更多南京力量。

責(zé)編：胡安靜

版權(quán)和免責(zé)聲明

版權(quán)聲明： 凡來源為"交匯點(diǎn)、新華日報及其子報"或電頭為"新華報業(yè)網(wǎng)"的稿件，均為新華報業(yè)網(wǎng)獨(dú)家版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載或鏡像；授權(quán)轉(zhuǎn)載必須注明來源為"新華報業(yè)網(wǎng)"，并保留"新華報業(yè)網(wǎng)"的電頭。

免責(zé)聲明： 本站轉(zhuǎn)載稿件僅代表作者個人觀點(diǎn)，與新華報業(yè)網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí)，對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時性本站不作任何保證或者承諾，請讀者僅作參考，并請自行核實(shí)相關(guān)內(nèi)容。