古籍数字化十年,已形成可观的数据资产
经济观察报  6小时前

经济观察报 记者 宋馥李

2025年10月25日,中华书局古联公司成立十周年暨古籍智能化建设与应用高端论坛在中国国际出版交流中心召开。

中国出版集团有限公司副总经理张宏在致辞时谈到,古联公司在10年间构建了百亿余字古籍大数据,研发了国家级古籍数字化平台,承担了行业标准制定与人才培养任务。未来,希望古联公司能贯彻国家文化数字化战略,探索可持续发展路径,同时坚守“弘扬传统,服务学术”的初心,推动古籍内容活化;加快AI技术应用,实现从数据资源到知识服务的跨越。

中国新闻出版研究院院长冯士新谈到,古籍数字化是通过现代科技手段系统性地挖掘、激活和传播中华优秀传统文化,使之在当代焕发新生。古籍中优秀的内容特别是思想观念、人文精神、道德规范,通过数字化、智能化手段进行创造性解释和现代表达,可以使其与当代文化相适应,与现代社会相协调,滋养当代中国人的精神世界,服务好学术研究。针对古籍整理研究的痛点和需求,我们仍然需要不断创新,提供更高效的研究工具、更丰富的研究资源,助力学术研究和学术创新。

中国出版协会古籍出版工作委员会常务副主任吕健谈到,10年前的2015年,正是中国古籍出版行业积极探索数字化转型的关键时期,如何让沉睡千年的典籍在互联网时代活起来、传下去是全行业共同面对的重大课题。古联公司建设的《中华经典古籍库》汇聚了20余家专业古籍出版社资源,引领了行业协同发展,期待古联公司将来能推动古籍数字资源“走出去”,在国际舞台上讲好中国故事。

全国高等院校古籍整理研究工作委员会(古委会)秘书长卢伟介绍了古联公司与高校在共建数字人文实验室、设立“古联奖学金”等方面的深度合作。他同时披露,古委会40年来培养的古籍整理人才超1.1万人,未来将与古联公司深化AI时代的产学研合作。

中华书局古联公司总经理洪涛在演讲中提到,古联公司10年来打造了涵盖110亿字的古籍大数据中心,制定了行业广泛采用的古籍数字化标准体系,这些资源成为古联公司最重要的数据资产,也在为后续训练人工智能工具提供了坚实的基础。

据了解,中华书局是以高质量古籍整理本图书出版为核心的出版机构,而古联公司作为中华书局延伸的数字出版机构,致力于古籍数字化整理工作,补充从古籍原典数据到古籍整理本数据之间的不足。从2016年组建“古籍数字化与知识工程重点实验”至今,从最开始的自动标点到大语言模型等技术,古联公司在数字化创新、人才培养方面取得了长足的进展。今年8月份上线的古籍数字化整理的项目,更是计划利用未来10年的时间,打造涵盖15亿字的1万种明代集部文献的数字化整理项目。

2022年10月,全国古籍整理出版规划领导小组印发《2021—2035年国家古籍工作规划》,对加大古籍抢救保护力度、提高古籍整理研究能力、提升古籍整理出版水平、统筹古籍数字化建设等相关工作也进行了部署,中华书局古联公司承担了国家古籍数字化工程落地的具体工作。