IT之家 2 月 8 日消息,字节跳动宣布,由其参与建设的“《永乐大典》高清影像数据库(第一辑)”正式上线,这是国家图书馆馆藏 40 册《永乐大典》首次在线上公开,包括 75 卷内容,共涉及 14 个韵部、17 个韵字、1800 部书。
《永乐大典》编纂于明朝永乐年间,全书 22877 卷,分装 11095 册,共约 3.7 亿字,大量保存了中国 14 世纪以前的文学、艺术、史地、哲学和应用科学等方面资料,被誉为“世界有史以来最大的百科全书”。历经六百年,《永乐大典》仅存 400 余册残本,散落在 8 个国家和地区。
2021 年 11 月,国家图书馆委托国家图书馆出版社进行《永乐大典》高清数据库项目的制作。2021 年 12 月,北京大学数字人文研究中心开始承担该项目的设计与研发。研究中心以“北京大学-字节跳动数字人文开放实验室”为基地,整合北京大学和字节跳动双方的力量,组成联合设计与研发团队,建成了《永乐大典》高清影像数据库。
据介绍,页面最大的亮点是一本 3D 立体动画模型的《永乐大典》。用户点击相应按钮,可以旋转和翻页。
为了让用户对古籍有可感受、可触摸的沉浸式体验,字节跳动技术团队结合了多项 3D 技术。
例如,技术团队使用点光、平行光、漫反射光等不同的光源,并为这些光源配置不同的位置、角度、光照强度、光源颜色、光源衰减量,力求 360 度还原《永乐大典》原貌。
同时,利用阴影材质(可以接收阴影,但在其他方面完全透明)组件,通过调整组件的位置、旋转角度以及透明度,技术团队还原了古籍的光影效果。
在旋转过程中,《永乐大典》的阴影应始终保持在页面下方。技术团队构建模型,使之能够跟随鼠标 360 度转动,且实现模型的惯性转动。
3D 版《永乐大典》面向大众,需要兼顾不同设备。技术团队通过书籍内页材质的延迟加载、模型源文件压缩、模型动画帧按需加载、模型预加载等手段,让每位用户都能流畅地欣赏大典风貌。
此外,专题交互页面还有一个亮点,即用背景动画与音效,展现了《永乐大典》的曲折历史。
《永乐大典》汇集了先秦至明初的各类典籍。然而,在过去,《永乐大典》往往只有在博物馆才能看到。部分网站流传的电子版,也十分零散,且因为是影印版,难以便捷检索。
现在,字节跳动技术团队使用服务端渲染等技术,结合基础架构,提供了集纳式的文本阅读平台。用户可随时、随地翻阅大典,从而有机会更深入地了解这一中华典籍瑰宝。
在专题交互页面右上角点击“阅读大典”,用户即可进入文本阅读平台。
这里有《永乐大典》原本影像,与数字化文本相互对照。繁简体转换功能,便于用户高效获取内容。
选中文本,点击“查看引用”,每句话的出处,都变得清晰可考。
除呈现《永乐大典》的影像和文本外,平台还尝试对部分大典内容做了知识标引示范,方便用户在检索的同时,掌握背景知识。
2021 年 6 月,字节跳动捐赠首批资金 1000 万元,联合中国文物保护基金会设立古籍保护专项基金,并与国家图书馆合作,定向资助古籍修复、人才培养、古籍活化与数字化等。截至 2022 年 12 月,该项目已修复完成古籍 98 册(件)。《永乐大典》“湖”字册修复,也正在进行中。
在古籍数字化方面,2022 年 10 月,北京大学携手字节跳动推出“识典古籍”平台,目前已上线 685 部经典古籍。其中,就包含此次公开的《永乐大典》高清数据库。
IT之家小伙伴们可以点此进入古籍数字化平台“识典古籍”浏览《永乐大典》。