档案数字化成果数据工作
是档案信息资源建设的重要内容
但在检测过程中
一旦数据库出错或影像数据不合格
就需要重新校对、返工等
不仅浪费几倍的时间和精力
还会导致项目周期严重拉长
增加无用功,得不偿失!
而利用人工智能算法开发的质检设备之后
成果数据检测容易出现的问题
一下子就得到解决了
近日,江苏省昆山市档案馆AI智能校对系统正式上线应用,成为以人工智能为代表的新型信息技术应用在数字档案馆建设中的一个突破。
为破解数据资源人工质检工作中,由于数据量大造成的效率低、漏检、错检等问题,市档案馆在市大数据中心的支持配合下,于去年9月启动基于机器学习算法的AI智能校对系统研发工作,将大量的档案数据机器学习与人工智能服务中台的文字识别(OCR)服务、自然语言(NLP)分析服务进行对接,通过预处理模块、文本检测模块、文字识别模块、语义分析预处理模块、对比分析模块等后台功能把档案目录和全文进行智能编目索引,并与原目录内容进行比对,进而实现档案数据智能校对。
目前,该系统识别正确率已达90%以上。
-来源:国家档案局
档案成果数据的检测的内容主要包括:备份数据能否打开、数据信息是否完整、文件数量是否准确等。
在平时,这些数据检测的设备的工作量可能要连续工作几十、几百个小时,可想而知对于设备的可靠性要求也是非常高。
另一方面,计算机在使用中容易出现各种不可预知的故障,有的故障甚至是灾难性的,比如计算机病毒程序,破坏档案数字化数据,硬盘出现故障,导致数据泄密等。
质检机器人-畅影云检
数据质检存储新科技
按照档案数字化成果规范化相关要求,档案质检设备厂商-深圳畅飞扬独家研发一款数据质检机器人,它具有专利技术,自主知识产权,相比于传统人工抽检方式,效率可提升90%,数据识别准确率几乎达到100%。
可以实现数据全覆盖检测处理,自动盲查影像处理,自动筛查问题数据,并自动修正处理,7*24小时机器无人值班全自动化运行,对海量档案数据的全生命周期管理!
影像幅面大小转换
- 按幅面大小自动统计数量
- 自动折算幅面页数,及时掌握阶段数字化成果数量,方便进度管理。
多功能检测
- 支持图片数量检测
- 图片明亮度检测
- 容量合规性检测
- 分辨率正确性检测
- 格式合规性等多项检测
- 可按需点击检测项,无人值守模式下,自动检测作业
自定义报告模板
- 可根据不同的用户对象及特定元素要求,自定义输出检测报告模板,更具针对性地呈现检测结果。
- 管理自定义模板、自定义格式、常用数据分析记录和预置分析记录。
自动批量处理问题数据
- 针对检测结果,直接定位问题数据所在路径,快速修正,批量处理问题数据直至达标。
- 根据影像数据结果自动去除黑边、方向纠正、明亮度调整等
档案密级筛查及检测
- 支持对扫描件及目录数据内容进行密级检测
- 对特定敏感内容进行筛查标识。