導讀:據“南京農業(yè)大學校友會”官方公眾號,近日,南京農業(yè)大學信息管理學院王東波教授研究團隊在北京發(fā)布“荀子”古籍大語言模型。
據“南京農業(yè)大學校友會”官方公眾號,近日,南京農業(yè)大學信息管理學院王東波教授研究團隊在北京發(fā)布“荀子”古籍大語言模型。
據介紹,“荀子”大模型包含《四庫全書》在內的絕大多數傳世古籍文獻,擁有超過 20 億字的大型語料庫,是該校團隊在國家社科基金重大項目“中國古代典籍跨語言知識庫構建及應用研究”的支持下,聯合中華書局古聯公司推出的專門進行古籍處理與研究的智能工具。
南京農業(yè)大學表示,該模型擁有如下亮點:
智能標引:能夠對古籍中的內容進行高質量主題標引,幫助研究人員快速了解文章主題;
信息抽?。耗軌蜃詣訌墓偶谐槿£P鍵信息,如人物、事件、地點等,大大節(jié)省了信息整理時間;
詩歌生成:能夠根據給定的主題或關鍵詞,自動生成符合語法規(guī)則和韻律要求的古詩,為詩詞愛好者提供創(chuàng)作靈感;
高質量翻譯:對于難以理解的古籍文獻,能夠進行精準的現代文翻譯,幫助研究人員更好地理解原文含義;
閱讀理解:能夠對給出的古文文本進行分析解釋,實現對古籍文本的自動閱讀;
詞法分析:可以完成古籍文本的自動分詞和詞性標注,有效提升研究效率;
自動標點:可以快速完成古籍文本的斷句和標點,提升使用者對古籍文本的閱讀體驗。
該模型包含基座模型 XunziALLM 和對話模型 XunziChat 兩部分,用戶還可根據自己的需求使用本地訓練語料微調基座模型,從而使其在古籍下游處理任務上取得更優(yōu)越的處理性能。