10大优享服务
62项会员特权

古籍数字化网站

发布时间:2024-04-27 20:21:14 阅读次数:26962 分享有奖:
该方案给出古籍数字化的网站服务平台。主要包括下列模块:
扫描件预处理:对需要扫描的古籍文件上传并图像处理,去除噪点等图像增强工作。
文本文字分割:利用深度学习模型进行文字定位
古文字识别:对文字分割框进行识别
校正:复合的校正功能。包括识别错误反馈,分割反馈,并反馈给服务器进行增强训练
文本导出:将识别或校对的文本按照指定格式(txt,xml等)导出
用户管理:不同用户权限的管理设定
文本搜索:服务器端的优化搜索算法


本方案可以实现多服务器部署,满足业务场景下高并发需求。