【历史学】AIGC赋能古籍保护与活化利用

来源:人文之光网  发布时间:2025-06-13

      古籍承载着历史的记忆,传递着文化的基因,是中华文明源远流长、博大精深的象征和见证。但随着时间的推移,部分古籍也面临自然老化、人为损坏、灾难性事件等问题,古籍保护刻不容缓。

      近年来,我国陆续出台了多个古籍保护文件。《国务院办公厅关于进一步加强古籍保护工作的意见》要求科学规范地开展古籍保护工作,将传统修复技艺与现代技术相结合。《关于推进新时代古籍工作的意见》指出,要发挥科技保护支撑作用,推动古籍保护关键技术突破。《2021—2035年国家古籍工作规划》重点强调新技术在古籍数字化工作中的推广应用,推进古籍智能化利用。不难看出,国家鼓励图书馆等机构利用科技赋能古籍保护与活化利用。AIGC(生成式人工智能)在图像处理、自然语言处理等领域的突破性进展恰逢其时,为图书馆古籍保护与活化利用提供了新思路。

      目前,AIGC赋能古籍保护与活化的场景主要体现在四个方面:

      一是古籍文本处理与语义识别方面。古籍的文本处理是古籍保护中最基础但很重要的工作,包括图片转文字、古籍断句等。传统OCR光学识别古籍文字效率和质量不太理想。如今,利用人工智能技术,将光学识别与无监督单字聚类、小样本学习、主动学习等人工智能技术结合,可提高古籍文字识别能力。同时,也可快速完成古籍文本的标点标注,并生成白话文。

      二是古籍数字化修复与内容补全方面。古籍在漫长的历史岁月中,由于受到自然环境和人为因素的影响,会出现不同程度的破损、褪色、字迹模糊等问题,降低了古籍文本的可读性。AIGC在海量数据训练的基础上,利用图像增强算法、风格迁移算法,可将古籍缺失部分进行智能修复,并且生成的内容与原古籍风格一致。

      三是细颗粒度知识图谱构建与智能检索方面。中华文明源远流长,留存下来的典籍种类多、数量大,知识之间缺乏显性关联。AIGC可深层次挖掘古籍中时间、人物、地点等细颗粒度信息,同时,可根据细颗粒度信息的关联规则构建可视化知识图谱,为用户提供智能、高效的检索服务。

      四是个性化服务与交互创新方面。AIGC可做到对不同模态信息的高效整合,实现文字、图片、视频、数据、图表等内容的综合应用。AIGC可根据图书馆的需求,结合古籍文本信息,对图书馆古籍内容进行二次创作,帮助读者深入了解古籍内容。AIGC结合虚拟现实和增强现实等技术,可以让读者身临其境地感受典籍里所描绘的画面,增强古籍在读者尤其是青少年读者中的传播。

      当然,AIGC在为图书馆古籍保护与活化利用带来机遇的同时,也存在一些潜在风险,需要古籍保护工作者注意规避。包括AIGC生成内容失真、古籍数据安全等技术风险,AIGC算法一致性导致古籍文化特色丢失的伦理风险,AIGC生成内容的法律与版权风险等。因此,图书馆在使用AIGC技术赋能古籍保护与活化利用的同时,要做好潜在风险的规避工作。

      一是建立健全技术治理框架。图书馆要从质量控制和数据安全等方面入手,建立多维风险防控体系。在质量控制方面,以“生成—校验—反馈”闭环管理模式,组建跨学科专家委员会,对AIGC生成内容严格执行多轮专家审核机制。专家结合古籍文献的朝代、历史背景、写作风格等方面,对AIGC生成的古籍内容进行详细审核,并将正确结果及时反馈给AI大模型,进行优化调整。在数据安全方面,图书馆使用的AIGC平台应尽可能完成本地化部署,避免古籍数据外泄风险,保证数据安全。在数据存储方面,图书馆可采用区块链分布式存储架构,对古籍数据进行加密存储和管理。

      二是探索古籍数字化协同创新模式。在推进AIGC赋能古籍保护与活化的进程中,图书馆应该积极探索协同创新模式,实施“图书馆+科研机构+高校”一体化发展战略,充分发挥各方优势,全面提升AIGC大模型性能,以实现文献资源、技术研发与人才培育的有机整合,在古籍知识生产层面构建起多主体协同的创新生态系统。

      三是推动古籍数字化技术标准和相关法律制定。目前,图书馆、高校、企业等在古籍数字化过程中采用的技术标准存在一定差异,这对古籍数字资源的共享和整合带来了一定的技术障碍。图书馆作为开展古籍数字化的关键机构,应该联合高校、企业等,统一古籍数字化技术标准,明确古籍数字化采集、存储、处理等环节的技术要求和指标,确保不同机构开发的古籍数字资源相互兼容。同时,图书馆可以联合立法部门,制定AIGC生成内容的版权法规,明晰AIGC生成古籍内容的版权归属。规范AIGC在古籍数字化中的应用,推动建立AIGC古籍数字化服务联盟,力促AIGC大模型训练数据共享,避免出现文化偏差、语义错误等问题。

      四是加强古籍与人工智能复合型人才培养。图书馆可定期组织古籍工作人员参加AIGC相关的培训,提升古籍工作人员的技术水平,打造一支兼具古籍知识背景和计算机能力的高素质跨学科团队。同时,图书馆可以选派一些古籍工作人员到高校、科研机构或科技企业进行短期实训,学习最新的AI技术和古籍数字化应用案例,提升专业技能。从长远来看,图书馆还可与高校联合开展人才培养项目,定向培养古籍数字化领域的复合型人才,为图书馆储备后续技术力量。

      AIGC为图书馆古籍保护与活化利用带来了前所未有的机遇,在古籍修复、知识挖掘和用户服务等方面展现出巨大的应用潜力。图书馆应积极拥抱AIGC等新技术,同时,规避新技术使用中存在的风险,让沉睡的古籍再焕新生。

      (来源:《中国文化报》2025年6月13日,第7版;作者:姜云龙;图片来源:)

社科普及活动

学习宣传贯彻中国共产党第二十次
全国代表大会精神

党的十九届四中全会召开以来,在全国范围内掀起了学习贯彻全会精神的热潮。为深入学习贯彻党的十九届四中全会精神,聚焦理论研究成果,普及理论知识,人文之光网特开设“学习贯彻党的十九届四中全会精神”专题。

扫一扫关注

京社科微信公众号