日前,在中國世界級(jí)非遺悅讀系列叢書發(fā)布會(huì)上,南京農(nóng)業(yè)大學(xué)信息管理學(xué)院王東波教授團(tuán)隊(duì)聯(lián)合南京大學(xué)“術(shù)語與翻譯跨學(xué)科研究”基地,首次推出非遺領(lǐng)域大語言模型,為非物質(zhì)文化遺產(chǎn)的保護(hù)與傳播開辟了新路徑。
記者了解到,非物質(zhì)文化遺產(chǎn)傳承大多以口頭傳播為主,由于其內(nèi)容豐富而形式多樣,在傳承過程中極易隨著時(shí)間流逝而丟失。非遺領(lǐng)域大語言模型的推出可以有效推動(dòng)非物質(zhì)文化遺產(chǎn)的數(shù)字化保護(hù),助力傳統(tǒng)故事、技藝、習(xí)俗等內(nèi)容的數(shù)字化、知識(shí)化、系統(tǒng)化,從而建立非遺的長效保護(hù)體系,確保非物質(zhì)文化遺產(chǎn)的可持續(xù)發(fā)展。
“在非物質(zhì)文化遺產(chǎn)領(lǐng)域,數(shù)據(jù)的獨(dú)特性與復(fù)雜性成了領(lǐng)域化大模型構(gòu)建的關(guān)鍵挑戰(zhàn)?!蓖鯑|波介紹,為確保非遺大模型能夠精準(zhǔn)理解和運(yùn)用文化遺產(chǎn)領(lǐng)域的獨(dú)特知識(shí),研究團(tuán)隊(duì)在數(shù)據(jù)收集階段深入中國非物質(zhì)文化遺產(chǎn)網(wǎng),從機(jī)構(gòu)、政策、資源、咨詢、學(xué)術(shù)五大板塊獲取并整理了海量數(shù)據(jù),涵蓋了政策通知、新聞專題、學(xué)術(shù)建設(shè)及項(xiàng)目介紹等多維度信息。此外,團(tuán)隊(duì)還充分利用了學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫中的大量非遺相關(guān)期刊論文摘要,最終通過對網(wǎng)頁內(nèi)容的分類解析和期刊論文摘要的整理,構(gòu)建了一個(gè)內(nèi)容豐富、體量龐大的非遺領(lǐng)域預(yù)訓(xùn)練數(shù)據(jù)集。
值得一提的是,依托南京農(nóng)業(yè)大學(xué)高性能算力平臺(tái),研究團(tuán)隊(duì)在現(xiàn)有高性能大語言模型的基礎(chǔ)上訓(xùn)練了非遺領(lǐng)域基座大模型,并進(jìn)一步構(gòu)建了非遺對話大模型。
王東波介紹,非遺對話大模型可以實(shí)現(xiàn)非物質(zhì)文化遺產(chǎn)自動(dòng)化傳播與知識(shí)普及,并通過其強(qiáng)大的跨語言能力,助力非物質(zhì)文化遺產(chǎn)走向國際。非遺對話大模型還能夠?yàn)榉沁z傳承人提供更加便捷的技術(shù)支持,使非遺傳承人能夠更好地利用新技術(shù)實(shí)現(xiàn)非物質(zhì)文化遺產(chǎn)的創(chuàng)造性轉(zhuǎn)化。