“吾与点古籍自动整理平台”是由北京大学数字人文研究中心与中文在线集团元引公司联合开发的智能化古籍整理平台。该平台提供图片文字识别、自动句读、命名实体识别等基本古籍整理功能,目前自动句读标点功能已开放测试,图片文字识别、命名实体识别功能将于近期开放测试,敬请期待。 “吾与点”自动句读模型是基于预训练语言模型BERT实现的,利用开放古籍语料"殆知阁"(daizhige.org)和公开的古典诗词文集训练得到。目前,断句模型在古文语料上的准确率达到94.90%,在古典诗文和词文的准确率分别达到99.39%和97.61%。