
XR沉浸式电影《了不起的甲骨文·王子的荣耀》妇好人物形象。

三千年前的甲骨文。受访者供图

游客在殷墟博物馆体验数字化产品。杨之甜 摄
刘永革,现任安阳师范学院甲骨文信息处理教育部重点实验室主任。
他自2000年起致力于甲骨文信息处理研究,带领团队于2019年发布了全球首个免费甲骨文大数据平台“殷契文渊”;推动“甲骨文全球数字化回归计划”,利用数字技术进行甲骨文保护与传承;曾获“出彩河南人”2022最美教师等荣誉。
甲骨文信息处理教育部重点实验室
源于2000年安阳师范学院“甲骨文信息处理小组”,2009年被河南省教育厅确定为河南省高校重点实验室培育基地。2016年获批为河南省重点实验室,2017年实验室研究团队获批教育部创新团队,2018年获批教育部重点实验室立项建设。实验室公开发表甲骨文信息处理相关的学术论文200余篇,获省市级科技进步奖6项、专利著作权15项,出版专著20余部。
在多年甲骨文信息处理研究的基础上,实验室形成了甲骨文大数据平台、甲骨文识别与字形分析、甲骨文语言计算、甲骨文与殷墟科技考古四个稳定的研究方向,实验室着力打造的甲骨文大数据平台——“殷契文渊”,于2019年免费向全球开放,在学界引起广泛关注,备受海内外好评,也标志着甲骨文研究进入了“智能化”时代。
□本报全媒体记者 李琳 杨之甜
记者:您从2000年就开始琢磨如何让计算机能打出甲骨文,如今已走过20余年历程,尤其是“殷契文渊”的出现备受关注,能否为我们回顾一下这段探索之路?
刘永革:甲骨文是安阳的特色。我是学计算机的,2000年从西北工业大学毕业后回到刚升格为本科院校的安阳师范学院。当时学校研究甲骨文的老师遇到一个难题——写文章时无法用计算机输入甲骨文,便向我求助。我坚信,甲骨文作为汉字的源头,既然汉字能进入计算机,甲骨文也一定可以。
最初,我们聚焦甲骨文输入法研发,耗时数年终于研制成功,并且免费向专家推广,获得了广泛认可。之后,我们与历史学院合作,申请了国家社科基金项目“甲骨文图文资料库”,用12年时间建成了甲骨文数据库。2008年,我们成功申请到国家自然科学基金项目,聚焦甲骨文未识字的破译,从最初我一个人,逐渐组建起一支专业团队,开展甲骨文信息处理相关研究,先后建成多个语料库。2016年,实验室成为河南省重点实验室,2018年获评教育部重点实验室,一步步实现了甲骨文研究与计算机技术的深度绑定。
记者:在这20余年的探索中,您认为最关键的突破是什么?
刘永革:最关键的突破是让甲骨文成功“走进”计算机。一开始,我们尝试过拼音、五笔字型等输入方法,都无法适配甲骨文的符号特性,耗时两三年都没有突破。后来借助鼠标的普及,我们创新采用鼠标点击的方式,成功实现了甲骨文的计算机输入,这为后续所有甲骨文数字化研究奠定了基础,也是让甲骨文“活”起来的第一步。
记者:实验室在甲骨文数字化保护方面有哪些标志性成果?
刘永革:甲骨文的载体是龟甲、牛肩胛骨制成的有机物,长期存放容易风化,保护工作刻不容缓。目前实验室主要聚焦甲骨文研究、技术研发、文物保护、传播活化四大板块,其中数字化保护是重点工作,核心就是甲骨文“数字化回归”。
我们计划对全球16万片甲骨进行全方位、高保真采集,打破传统单一角度拍摄的局限,采用12个角度对甲骨单一面拍摄48张照片,正反面共96张,再结合红外线、紫外线拍摄,完整采集甲骨上的所有信息,即便未来甲骨原件风化,这些数据也能永久保存,为后续研究提供支撑。目前这项工作刚起步,已完成1526片甲骨的采集,虽然与16万片的目标还有很大差距,但我们会持续推进,力争在国家支持下完成这项基础性保护工作。
据了解,我们参与的“数字甲骨共创计划”已实现海外950片甲骨的数字化回归,覆盖4个国家的9家收藏机构,让流失海外的甲骨以数字形式“重返”殷墟。
记者:今年实验室在国际传播和数字展示方面有哪些计划?让海外关注者更直观地感受甲骨文的魅力。
刘永革:甲骨文不仅属于中国,更属于世界。目前甲骨文分布在全球15个国家,我们的数字化采集工作也是一场文化传播活动。此前我们去韩国采集就带去了甲骨文广播体操,让韩国民众近距离感受中国传统文化。今年计划赴英国开展一系列文化传播活动。
记者:提到甲骨文广播体操,它作为甲骨文活化传播的重要形式,目前在全国的推广情况如何?在甲骨文传播“破圈”方面,还有哪些新想法?
刘永革:甲骨文广播体操是我们推动甲骨文活化的重要尝试,它将19个甲骨文与体操动作结合,融合古文字、音乐、舞蹈、体育等多学科元素,实现了文化性、趣味性与训练性的统一。该体操2023年推出,2024年在安阳推广成效显著,2025年向全国推广,目前已覆盖14个省市、4600个单位,受众达500多万人。河南师范大学附中、华中科技大学附中已将其作为课间操,哈尔滨工业大学也在邀请我们前往传播。
我理解的“破圈”,就是让甲骨文融入大众生活。除了广播体操,我们还尝试结合“科目三”节奏对体操进行改造,增强趣味性;在安阳师范学院体育场举办过大型展演,吸引安阳市各机关单位参与,反响热烈。
记者:人才是传承发展的核心,实验室在甲骨文相关人才培养方面有哪些新举措?
刘永革:习近平总书记对甲骨文研究作出重要指示,强调要“有人做、有传承”,这正是我们人才培养的核心目标。实验室依托安阳师范学院,重点培养兼具计算机技术和甲骨文知识的复合型人才,在本科生、研究生中开设甲骨文相关课程,主编了两本“十四五”规划教材——《甲骨文信息处理》《甲骨文的传承与活化》,其中《甲骨文的传承与活化》将于今年由高等教育出版社出版,让更多学生了解甲骨文的创新应用。
记者:我们了解到,实验室正在开展甲骨文AI自动缀合研究并取得一定成果,这方面的优势和瓶颈分别是什么?
刘永革:我们所说的AI自动缀合,就是用计算机技术将破碎的甲骨碎片拼接完整。从2018年引进张展博士后,我们就明确了核心目标——不是为了发论文、申项目,而是真正用工程化思维解决甲骨文缀合难题。
我们的优势在于数据储备雄厚,广泛收集整理国内外甲骨文数据,服务器持续运行进行缀合计算,目前已完成155片甲骨的自动缀合,在国内外处于领先水平。
瓶颈则在于甲骨文缀合难度极大,需要兼顾字形、语义、先秦文献记载等多方面因素。有学者说,一个博士生毕业可能只能破译一个甲骨文单字,可见这项工作的艰巨性。不过我们没有放弃,目前正运用自然语言处理、大语言模型等技术,联合厦门大学、华中科技大学、腾讯公司等单位协同攻关,去年已取得小幅进展,未来会持续推进。
记者:当前,实验室在甲骨文AI技术研发上的核心投入方向是什么?是否有对外合作的计划?
刘永革:合作一直是我们的重要工作方式,目前已与哈尔滨工业大学、清华大学、天津大学、厦门大学等高校,以及腾讯公司、知网等企业建立深度合作。AI技术研发的核心是数据,“人工智能,有多少人工就有多少智能”,所以我们当前的首要任务是整理完善甲骨文文献、甲骨文本体两类核心数据。
记者:能否介绍一下2026年实验室的重点任务和推进计划?
刘永革:2026年我们的核心目标是推动甲骨文AI技术再上新台阶。一方面,持续扩充数据储备,将“殷契行止”甲骨文智能体的参考文献从2000篇提升至3万篇,多模态数据集完成5万片标注,大幅提升智能体的研究能力;另一方面,重点推进甲骨文大语言模型的研制,通过甲骨文数据对通用大语言模型进行微调,让机器真正“理解”甲骨文。
如果这些目标能够实现,不仅能加快甲骨文识别、缀合、破译的速度,更能为甲骨文研究提供全新支撑,让这一古老中华文明在科技的赋能下,更好地传承下去、传播开来。