慧眼识珠
档案数字化成果及電(diàn)子档案校验系统
國(guó)家5A级项目成果
研发背景
随着信息化建设进程加速推进,全國(guó)大部分(fēn)地方档案馆已由传统纸质(zhì)档案保管过渡到依靠计算机系统化管理(lǐ)时代。
各地档案馆也已由单套制向双套制接收快速迈进,档案馆面临前所未有(yǒu)的结构化数据接收压力。 由于缺乏专业的检测平台,只能(néng)被迫采取少部分(fēn)抽检的方式,从而导致对接收数据存在检验不全面、不真实及较高批量接收后的质(zhì)量风险。
该平台的诞生,彻底的改变了人為(wèi)主观对验收结果的判断,以系统全检代替人工(gōng)抽验,实现数量接收准确无误,质(zhì)量接收零风险。
产(chǎn)品特点
系统介绍
产(chǎn)品优势
利用(yòng)AI智能(néng)技(jì )术,结合档案行业标准,定向开发合规审查产(chǎn)品,更贴合档案馆使用(yòng)需求;
根据各级单位不同需求、不同标准可(kě)以自行设定审查参数,高度灵活便捷;
审查流程自动化,更高效,全面提升数据审查效率;
数据审查更全面(污点、黑边、倾斜度、重复页(yè)、空白页(yè)、装(zhuāng)订孔、目录格式等),一次性审查,自动输出审查报告;
全面审查数据合规性,规避传统抽查方式的不全面、不准确性;
可(kě)全面反映不合格数据系统日志(zhì),方便整改工(gōng)作(zuò)的开展,无需人工(gōng)全面自查整改,费时费力;
解决方案
激扬研发了基于AI的全自动影像识别技(jì )术的《電(diàn)子档案校验系统》,可(kě)对多(duō)种类证件、名(míng)片、通用(yòng)文(wén)档、通用(yòng)表单识别进行精(jīng)准识别,准确率超过99%;根据业務(wù)需要提取相关归档字段,提高查档效率。
数据质(zhì)量问题解决策略
01.质(zhì)量检查
02.质(zhì)量控制
03.全面质(zhì)量管理(lǐ)
04.数据积累
05.数据管理(lǐ)
06.数据治理(lǐ)
校验策略
系统自动校验
对校验文(wén)件进行备份后,通过逆向追溯进行逐一排查
系统辅助校验
对校验文(wén)件进行备份后,通过逆向追溯进行逐一排查
人工(gōng)辅助校验
对校验文(wén)件进行备份后,通过逆向追溯进行逐一排查
档案修正策略
功能(néng)模块
数据预处理(lǐ)系统
支持excel文(wén)件上传著录数据,或直接连接数据库导入数据。可(kě)挂接pdf影像文(wén)件。
数据分(fēn)析系统
通过四性检测对著录数据与影像数据的完整性、准确性、规范性等方面进行校验。对影像文(wén)件的图片黑边、倾斜角度等问题进行识别。根据多(duō)种不同的策略模板,对著录文(wén)件的数据合法性进行校验。
自动校正系统
通过系统自动校验,将部分(fēn)可(kě)以由系统自行处理(lǐ)纠正的数据按全宗、目录的方式进行自动处理(lǐ),并标识出来,以供用(yòng)户检验。对有(yǒu)黑边、倾斜的影像文(wén)件进行自动处理(lǐ)。
辅助确认系统
通过影像对比、著录数据修改功能(néng)模块,由人工(gōng)对系统识别出的著录与影像文(wén)件进行进一步确认与验证。
精(jīng)确定位筛查系统
在完成前四个步骤的基础上,通过粘贴電(diàn)子标签,同时对档案实體(tǐ)、著录数据和電(diàn)子档案进一步进行人工(gōng)校对,重点是错别字和其它系统无法自动判定的错误的筛查处理(lǐ)。
人工(gōng)修正系统
激扬采取“查的人不改,改的人不查”的策略,确保查改分(fēn)离,相互验证。由修正角色对人工(gōng)辅助校验系统和精(jīng)确定位筛查系统确定的错误进行修正、补充扫描和其它处理(lǐ)。
多(duō)轮质(zhì)检系统
通过即时的、高强度的三轮质(zhì)检,确保查到的错误全部修正正确。
校验报告系统
按照全宗分(fēn)别统计汇总相关校验过程和结果信息,以动态图形界面和生成书面报告的形式,形成检校成果,对数据成果进行鉴定。