张重生:

AI缀合,让甲骨重获新生(了不起的甲骨文)

《河南日报》 (2024年08月21日 第 05 版)

  张重生教授在工作中。河南日报社全媒体记者 杨致文 摄

  □河南日报社全媒体记者 张熠 朱晓玲

  近年来,用人工智能辅助古文字研究成为学界的重要课题。2020年,全国首款AI甲骨缀合产品——“缀多多”正式推出,首次实现了人工智能批量缀合甲骨。当古老的甲骨文遇上AI技术,会碰撞出怎样的火花?交叉跨界的研究者对此深有感悟。立秋时节,记者专访了河南大学计算机与信息工程学院教授、河南大学黄河文化遗产实验室研究员张重生。

  缀合是甲骨重获新生的必经之路

  甲骨缀合,就是综合利用甲骨的各方面信息,将两片及以上的甲骨碎片拼接起来,变为完整或较为完整的材料。“比方说,3个花瓶打碎了,有5000多片各种形态的碎片,运用AI技术把这些碎片重组复原,这就是我在做的事情。”张重生这样描述他的工作。

  作为最早的成系统的汉字,甲骨文是研究商周文化的第一手材料,而距今三千多年的商周甲骨破碎十分严重,目前发现的约16万片甲骨中,碎片占90%以上。为了更好地研究利用甲骨这一珍贵遗产,必须开展甲骨碎片的缀合复原工作。因为缀合并非通过甲骨实物,而是通过拓片和摹本,还要考虑到重复和仿制的问题,复杂性不言而喻。

  张重生介绍,近年来利用计算机图像辅助甲骨缀合是最高效也是最经济的办法。很多从事甲骨缀合的学者都利用计算机来提高缀合效率,但过去的计算机缀合模型没有起到完全缀合的作用,甲骨学家还需承担大量的缀合工作,劳动强度很大。近几年,人工智能技术的突飞猛进,让研究者有机会更接近完全缀合的目标。

  完整缀合出一块甲骨不亚于发现一块新甲骨

  将三千多年前的甲骨碎片“拼拼图”,是破译古文字的基础。甲骨学者普遍认为,缀合出一块较为完整的、可用于甲骨文研究的甲骨,其价值不亚于发现一块新的甲骨。

  张重生表示,缀合的每组甲骨具有唯一性。甲骨缀合,不仅要求甲骨的形状能严丝合缝连接,甲骨正反两面的纹路也要能对上,还要检查所刻的文字,从字体、风格再到叙事内容都要契合。

  更复杂的是,由于甲骨分散在世界各地的博物馆、大学或研究机构,需要相关数据信息共享。“我们可以用数字化的方法进行甲骨碎片缀合还原,让相关学者将内容破译出来,继续研究。”张重生说。

  “甲骨缀合是项苦差事。边缘记忆和匹配能力对于人脑来说是比较困难的,这恰恰是人工智能擅长的领域。”2018年,张重生团队开创了AI自动识别甲骨文的新范式,极大超越了传统算法。考虑到精准复原甲骨是学界的重大现实需求,团队从2019年开始设计甲骨缀合算法,并于2020年与首都师范大学联合研发出AI缀合软件“缀多多”,实验阶段甲骨缀合准确率达99%左右;应用阶段准确率为85%左右,在甲骨学历史上首次实现了人工智能批量缀合甲骨。

  当前AI缀合还处于初级阶段

  用AI缀合甲骨还有很多难题待解。张重生介绍,甲骨中的每个文字数据量分布非常不均衡,有些字出现的频率非常高,如“王”和“贞”,而另外一些字出现的频率则较低。目前,人工智能技术只能识别出现频率较高的甲骨文,对出现频率较低的甲骨文有可能识别不出来或正确率不高。对于甲骨文中的形似字,如“夕”和“月”,“比”和“从”,在形态上非常相似,只能依靠专家的经验辨识。此外,文字不是孤立地存在的,需要放入具体的文本环境中进行理解,而文本环境具有一定的不确定性,这无疑增加了甲骨文破译的难度。

  对于利用人工智能破译甲骨文的前景,张重生认为,目前人工智能与古文字研究的结合还处于初级阶段,人工智能在对问题的规划求解、语义理解和创新知识等方面仍处于辅助地位,所以在未来较长的一段时间里,“人机耦合”将会是研究甲骨文的主要形态。所谓“人机耦合”,就是人与机器进行紧密结合和相互协作,在AI擅长的领域解决对人类智能来说比较困难的问题,在人类智能比较擅长的领域解决AI比较困难的问题。通过“人机耦合”,最终完整地解决问题。

  “下一步,我希望AI缀合可以赋能更多的古文献研究,例如,秦汉简牍、敦煌遗书、吐鲁番文书等。”张重生说,“我的名字叫张重生,而我的工作就是让出土文献重获新生,所以我经常开玩笑说,我的名字已经说明了我的使命。”

河南日报特刊 05AI缀合,让甲骨重获新生(了不起的甲骨文) 2024-08-21 2 2024年08月21日 星期三