近日,合合信息联合上海大学、华南理工大学发布了业内首个古彝文基础编码数据库,使古彝文在数字社会中从此有了“身份证号码”。古彝文是中华民族传统文化的重要组成部分,而这一编码数据库的发布,将有助于广大用户更方便地学习和研究古彝文,同时,也将有助于有关部门更好地保护和传承这一独特的文化遗产。
据悉,该项目由合合信息与上海大学社会学院、华南理工大学文档图像分析识别与理解实验室共同推进,共同将现有的《西南彝志》、云贵一带字符在智能图像处理、智能文字识别等 AI 技术下展开统一编码,构建古彝文“大字典”。三方的合作,为解决数据库建设中的学术性、技术性难点提供了强大的技术支持。
扫描全能王“智能高清滤镜”古籍扫描效果(图源:西南彝志)
在古彝文语料收集过程中,被记录在岩书、布书、竹简等载体上的传统古彝文受时间和保存方式影响,往往变得模糊不清或残缺不全,低质量图片资料如何优化成为首要问题。为此,研究团队选取合合信息旗下的智能扫描产品“扫描全能王”作为古籍图片采集工具,利用该产品基于AI技术及智能扫描引擎实现的“智能高清滤镜”功能,可自动检测图像中存在的问题,并智能判定图像的优化方式,一键处理模糊、阴影、手指、屏幕纹等干扰因素,减轻后续图片处理工作,缩短内容识别、编码的操作周期。
在智能文字识别领域已有十余年深耕经验的合合信息,已在AI识别甲骨文、西周钟鼎文(金文)领域拥有领先的探索,不仅为古彝文等传统文字“数字化”识别提供了更完备的技术基础,也为其他领域的基础数据库建设提供了借鉴和参考。与此同时,扫描全能王同步启动了发动社会力量参与古彝文识别和保护的公益性活动,上线古彝文典籍上传入口、面向全社会征集古籍资料,助力中华文化瑰宝传承。
对于古彝文的研究和传承来说,这次编码数据库的发布无疑是一个重要的里程碑。相信在合合信息、上海大学社会学院和华南理工大学三方的共同努力下,古彝文将在数字社会中焕发新的光彩。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
标签: