技术进步不但不会淘汰传统文化,反而让传统文化复活,让它们诞生新生命。
本篇文章,主要谈谈笔者一直非常感兴趣,看似非常冷门,又很重要的一个话题。
笔者上周参观了一下国家图书馆的古籍展览,这是第三次看这个展览,不过跟逛故宫一样,每次看都有不同的心得,并不觉得有腻烦。这里的珍贵典藏有:甲骨文,这是国内甲骨文收藏最多,也是最精品的部分,并且这些甲骨文的来历都很不一般,我们可以看到王懿荣、罗振玉、郭沫若等人的藏品;战国、秦汉竹简,以及蔡邕所刻的《熹平石经》残片;历代印刷善本,如宋代印刷的多本儒家经典著作,这是目前保存下来的仅有的南宋皇家典藏;中国四大收藏的《敦煌遗书》、《赵城金藏》、《永乐大典》和《四库全书》的最精华部分。
(文津街的国家图书馆古籍馆,以及国图北馆向公众展出的宋代善本、赵城金藏、敦煌经卷、吐鲁番文献)
如果说故宫保存了全国书画、珠宝和瓷器的精华,国家博物馆保存了考古精华,国家图书馆古籍馆则保存了历代书籍、经卷等印刷品的精华,可并列为中华文脉的三个主要组成部分。不过前两者因地理位置和传媒的原因,知名度远远大于后者。其实读者有兴趣的话,可以来看看,一定可以大饱眼福。
笔者从上大学时就非常爱好搜集古籍善本,节省的钱很大一部分用来购买古旧书籍,其中不乏稀有资料。后来把最心爱的一部分珍藏,无偿捐献给了某所著名大学图书馆,笔者认为这些资源与大家共享,才能发挥它的最大用处。
笔者在海外游学时,也特别注重了解那里的汉文古籍典藏。2018年笔者在哈佛访学,在燕京图书馆热心馆员的帮助下,得以目睹这里的珍贵古籍,大约一共15万册,无论数量上、还是质量上,在西方图书馆中都是冠军,最珍贵的有:宋刻本《纂图互注扬子法言》、《六度集经》、《大般若波罗蜜多经》、《汉书》,明刻本《世说新语》和1728年的《古今图书集成》等,这些放在国内也都是国宝级文物。笔者还曾经在俄罗斯科学院东方学研究所看过这里的中国古籍典藏,这里最知名的是西夏的黑水文献。
(哈佛燕京图书馆)
日本汉文古籍之丰富,质量之高是其他国家难以企及的,整个日本约有91万部汉文古籍,约等于中国全国藏品的三分之一。去年笔者去日本,特意又参观了这里的最重要的几个汉籍收藏重镇,分别是:日本内阁文库、国会图书馆、金泽文库、东洋文库和静嘉堂。
这出于两方面原因,一方面日本以前就是汉字文化圈,自从唐代开始就从中国大量采购图书,由于日本战乱少,这些古籍能够比较完整保存下来,比如东京国立博物馆有印于唐代的《尚书》、《毛诗》、《世说新语》、《王勃集》等,据我所知,国内已经没有唐代善本图书了,在唐宋元战乱中均被焚毁,但是在日本还可以看得到;在神奈川一个小镇上,有个建于镰仓幕府时代的金泽文库,这里保存了35000余部宋元明清善本,约等于中国国图搜集的全国最佳善本的四分之一。
(东京国立博物馆的《尚书》,大致印刷于唐太宗年代,是目前世界上现存最早印刷品之一,比敦煌藏经洞的《金刚经》还要早200余年)
另一方面,日本在近代出于侵略或文化炫耀的需要,从中国购买或抢掠了很多珍贵古籍,比如三菱财团创始人岩崎弥之助非常喜欢中国文化,于是成立静嘉堂搜集中国文物,收获最大的举措就是打包购买了江南四大藏书楼之一的皕宋楼全品。静嘉堂收藏的宋元善本之多令人昨舌,其中宋代珍品就有《周礼》残本2册、《说文解字》8册、《汉书》40册、《唐书》90册、《李太白文集》12册等,均被列为日本的“国家重要文化财”。
(静嘉堂的北宋版《说文解字》)
站在我们今人角度讲,古籍相关工作一方面是搜集和保存,下一步更重要的就是典校和传播了,这样才能成为活文化,否则就是“死文物”。
中国古籍虽然在历代战争中,遭受了巨大损毁,但是保存下来的数量依然很客观。据文化部组织的古籍资源普查,全国有清代以前古籍有260万部、3000多万册,仅国家图书馆里就保存了15万部、近300多万册。
不过由于之前人力和技术有限,古籍保存、典校、传播都做的远远抵不上它所具有的文化价值,以至于古籍研究成为小众又小众的“冷学问”和“死学问”,大众既难以接触古籍,也没有机会了解古籍,文化遗产的价值得不到发挥。
例如,国家图书馆牵头国内几十家图书馆进行的中华古籍资源电子化工程,所整理、出版、电子化的部分目前仅有13万余件(其中国图约2.5万余件),只是馆藏的冰山一角。这对整个民族来说都是一种损失,比方说,很多古代历史的密码都在敦煌文书里面,但是因为对它的整理远远不够,妨碍了我们对自己文明的研究;再比方说,很多中医类文献因为没有电子化,好多药方和诊断经验也就不能为今人所用。
某种程度上来说,哈佛大学和美国国家图书馆在中文古籍资源电子化和共享上的经验,反而值得国内借鉴。虽然汉籍不是他们的本土文化,发掘整理这些没有任何民族自尊心和自豪感的需要,但是这两个部门分别把收藏的5.3万册和3.5万册中文古籍善本全部电子化,供全球所有上网者免费查阅。
(哈佛大学和美国国会图书馆的中文古籍电子资源共享平台)
所以,整理、共享这些古籍,是发掘传统文化中的一个极其重要话题。不过笔者认为AI技术的突飞猛进,为之提供了新的契机。比如,字节跳动从2022年3月起,与北京大学合作设立古籍保护专项基金,利用其强大的数字技术优势,为古籍点校、电子化和传播赋能。据笔者了解,有以下部分:
1. 利用AI为OCR技术升级,大大加速了加速古籍的自动识别转化,新的OCR技术、文字版式识别、自动标点、自动命名实体识别、自动翻译等功能,大大加快了从图书馆库房到电子资源平台的转化速度。
2. 搭建更强大的检索和查阅平台,目前该平台已免费开放16000余部古籍,包括《永乐大典》、哈佛燕京文献、《四库全书》、《明实录》《清实录》等受关注度高的古籍。并上线了图文对照、繁简转换、字典释义、文白对照、实体百科、实体关系图等功能,使得普通大众很方便阅读古籍,大大降低了解古籍的门槛。
(字节搭建的古籍资源开放平台“识典古籍”,并联合国家图书馆将国家文化瑰宝《永乐大典》电子化)
尤其是2024年3月,字节基于本企业研发的豆包大语言模型,又研发了 “古籍智能助手”,这是国内大语言模型技术在古籍数字化领域的有益尝试。
3. 依托依托识典古籍平台,发动社会参与古籍整理,目前成功举办了“我是‘校书官’古籍大众智能整理计划”一期,1万名学生报名,覆盖了1210所高校,整理古籍1643 部。3月26日, “我用AI校古籍”在武汉大学启动,今年的活动有来自22所高校的27个院系。字节创造的这种发动公众参与的方式很值得借鉴,让更多年轻人参与进来,整理的过程也是阅读和了解的过程,更是激发对文明认知的过程。
4.向北大教育基金会捐赠2500万元,用于资助北京大学《儒藏》工程,一方面支援儒藏经典的整理,另一方面将相关成果在识典古籍上线。《儒藏》工程是有史以来最大规模的海内外儒学典籍整理工程,涵盖了中韩日越四国千年来最珍贵的3500余种儒家著作研究,过去《儒藏》只有一些大学图书馆有收藏,如果实现对这项工程的电子化分享,让公众有机会了解,无疑有很重要文明意义,也对逝去的汤一介等工程牵头人的最好告慰。
(卷帙浩繁的《儒藏》将随着AI技术的介入而电子化)
所以说很多时候,技术进步不但不会淘汰传统文化,反而让传统文化复活,让它们诞生了新生命。我们虽然距离线装书流行的时代越来越远,但是AI技术的出现,却又让当下成为距离完成所有古籍整理最近的时代,我们期待以后有越来越多的科技企业,能有文化公共关怀,利用科技的渠道,让传统文明与现代社会连接起来,我们的文化才越来越有活力,中国文明的底蕴才能有更多绽现。
我们也期待随着我国人工智能技术的进步,所参与的企业、社会机构越来越多,可以把所有的流落在海外珍藏电子资源电子化,虽然我们不能收回这些实物,但是仍可以有机会汲取这些流散在外的文明精华。