高速单证扫描识别系统PRD 联系客服

发布时间 : 星期三 文章高速单证扫描识别系统PRD更新完毕开始阅读39894332eefdc8d376ee32b6

企业文档扫描服务数字加工流程:

易通物流公司使用的HP 7000n扫描仪,一名员工进行数百张单据的电子化存储,仅需不到十分钟就可完成。电子文档相比传统的纸质保存,不仅实现了更加安全的备份,而且可以在电脑中直接查询,非常方便。

扫描仪的扫描技巧

不少用户在购买扫描仪后,常常会发现扫描图片的品质不太理想,实际上,出现这种情况,主要的还是与用户使用扫描仪的技巧密切相关。

准备工作要做好

普通用户在使用扫描仪之前,很有必要对扫描仪的基本原理做个初步的了解,这样将大大有助于正确合理地使用扫描仪。扫描仪获取图像的方式是将光线照射到待扫描的图片或文档上,光线反射后由感光元件——CCD(Charge Coupled Device,电荷耦合元件)或CIS(Contact Image Sensor)接收,由于图像色彩深浅不一,致使反射光强度也各不相同,感光元件可以接收各种强度的光,并转换为二进制的数字信号,最后由控制扫描的软件将这些数据还原为显示器上可以看到的图像。

为了将图像客观真实地反映出来,必须保证光线能够平稳地照到待扫描的稿件上,笔者建议大家在扫描前可以先打开扫描仪预热5至10分钟,使机器内的灯管达到均匀发光状态,这样可以确保光线平均照到稿件每一处。此外,不要因扫描仪的倾斜或抖动影响到扫描品质,用户应尽量找一处比较平坦、稳定的地方放置,一些用户为节约办公空间而直接将扫描仪置于机箱上方的做法万万不可取。现在,佳能公司的N系列扫描仪都实现了直立扫描,配有专用扫描仪支架,有效的节约了办公空间。此外,扫描前仔细检查玻璃上方是否有污渍,若有一定要用软布擦拭干净,以免影响扫描效果。

预扫步骤不可少

为了节约扫描时间,一些用户贪图方便,常常忽略预扫步骤。其实,在正式扫描前,预扫功能是非常必要的,它是保证扫描效果的第一道关卡。通过预扫有两方面的好处,一是在通过预扫后的图像我们可以直接确定自已所需要招描的区域,以减少扫描后对图像的处理工序;二是可通过观察预扫后的图像,我们大致可以看到图像的色彩、效果等,如不满意可对扫描参数重新进行设定、调整之后再进行扫描。

限于扫描仪的工作原理,扫描得到的图像或多或少会出现失真或变形。因此,好的原稿对得到高品质的扫描效果是格外重要的,而品质不佳的原稿,即使通过软件处理可以改善扫描效果,但终究属亡羊补牢的做法。至于那些污损严重的图像,无论如何处理也无法得到期待的效果,因此,一定要尽量使用品质出色的原稿扫描。对一些尺寸较小的稿件,应尽量放置在扫描仪中央,这样可以减少变形的产生。

使用多大的分辨率

很多用户在使用扫描仪时,常常会产生采用多大分辨率扫描的疑问。其实,这还得由用户的实际应用需求决定。分辨率越高意味着可以获得更多的图像细节,更清晰的效果,更完美的色彩还原力,但同时也意味着扫描得到的图像文件增大而且不易处理。对应用较多的Internet而言,网站上的图片分辨率通常在75dpi左右,这意味着使用100dpi分辨率进行扫描已绰绰有余,而用于印刷的图片的分辨率一般为300至400dpi,因此要想将作品通过扫描印刷出版,至少需要用到300dpi以上的分辨率,当然若能使用600dpi则更佳。如果想将扫描后的作品通过打印机打印出来,则必须综合考虑打印机的分辨率才能决定。根据实际使用经验,一台打印分辨率为1440dpi的打印机,大约只需以360dpi分辨率扫描图像即可得到不错的打印效果。这是因为打印机与扫描仪的工作原理和分辨率的含义完全不同的缘故。

应用广泛的OCR

相信不少朋友购买扫描仪很大部分用途是为了减少文字输入工作量,提高工作效率。因此,OCR就成了扫描仪最常被使用的功能之一。通过软件识别扫描文档上的汉字、英文,甚为方便且有效。因此,除了掌握正确的扫描方法外,选择合适的OCR软件也极为重要。目前常用的OCR软件大多是与扫描仪捆绑销售的,比如佳能扫描仪的RosettaStone、Omnipage等。尽管OCR软件可以自动识别汉字,但要达到高效准确也需要众多应用技巧。

首先,扫描文档时需使用黑白模式,同时也要注意这种模式下的Threshold值(阈值,表示一个参数范围,大于或小于这个范围都不能产生效应),这是决定何种程度的黑色可被扫描仪视为黑点,这样可以简便地将文字的黑与背景干扰的黑分辨出来,如果调整得当,可加快扫描速度。这个值的调整可以在扫描图像的色调值(tone value)统计直方图(Histogram)中,先区分出两个或以上的波峰,然后将Threshold在两者之间调整,便能找到具备不错区分效果的位置。如果认为这种方式较麻烦,还有另一个简便方法,通过文字大小来决定分辨率。一般来说,200或300dpi的分辨率可以得到相当不错的效果。如果待扫描的文字比报刊文字还要小,可以将分辨率提高,从而得到可放大的扫描文档,提升识别率。

当用户需要扫描厚度较大的杂志时,若直接扫描,难免会发生内文因无法完全摊开而导

致部分文字不清晰及扭曲失真的情况,这样的结果是OCR软件无法正确识别的,大大降低识别率。怎么办呢?用户不妨在扫描前,将图书拆成一页页的单张,然后再进行扫描。对于一般的报纸,由于本身即是单张形式,因此不存在上述问题,但由于报纸面积通常较大,无法一次扫描,因此预扫时事先框选扫描范围,一次扫描一块区域,这样的辨识效果会大大提高。

透射稿及其它印刷品

除了扫描普通的反射稿外,用户有时也需扫描透射稿。透射稿包括幻灯片(正片)、负片两种。由于一般的扫描仪是针对反射稿扫描设计,因此在扫描透射稿时建议使用具有胶片扫描功能的佳能全能D660U、FB1210U、D1230UF、D2400UF及专用胶片扫描仪FS 4000US。

DigiScan单证扫描识别系统

DigiScan是一套用于表单扫描、识别的系统。它通过扫描将传统资料转换为电子文档,并通过OCR识别技术自动建立索引,识别完成之后,系统会根据识别结果将所有图象划分为不同文档,并提供文档间的导航工具条,用于文档之间的切换,同时,弹出一个新的浮动窗口,供校对识别结果。在确认识别结果之后可以根据识别结果建立索引导入数据库系统进行管理,也可以供业务、服务等相关部门进行网上查询。如果结合DigiForm电子表单系统,可传输影像文件到DigiForm,使系统能够自动打印表单原始资料,大大减轻了人工操作。

本系统通过建立一系列模板,可为每种资料提供不同的工作参数。工作时,首先按照模板设置进行批量扫描,之后进行OCR自动识别,并根据模板设置的不同区分方式自动将批量资料进行区分。识别结果为关键索引,根据该索引对影像文件进行管理,也可以提供接口以方便DigiForm电子表单系统调入影像进行打印。 工作流程如下:

扫描--->OCR识别---->建立文件索引----> 图像传输 ----> 数据库管理

主要特性

支持自动进纸的高速扫描仪,达到比普通平板扫描仪快几倍甚至十几倍的扫描速度。

对扫描影像自动进行去污、纠偏等操作,最大限度地还原原始资料。

支持以文件直接载入的方式进行操作,并可在扫描时备份临时文件,保证在意外事故发生时将损

失减小。

扫描或载入文件之后,可手工对影像顺序、质量等进行调整、控制。

通过模板的概念设定系统的工作参数,保存方便。

根据模板设置自动对影像进行识别,并自动建立索引信息(表单号)。

提供识别结果的校验功能,确保识别结果的正确性。

结合DigiForm电子表单系统,可将本系统的图像资料传输到DigiForm,使电子表单系统打印时能

自动打印表单原始资料,减轻人工操作。

完善的用户管理机制,以保证系统的安全运行。

系统操作界面

应用

实达DigiScan数码扫描系统主要应用于企事业单位的单证电子化,如保险公司的投保单电子化管理,企业财务资料电子化管理,税务机关纳税人资料电子化管理、金融和邮电系统客户资料电子化管理等。

原始记账凭证经临柜有关部门封包后送事后监督部门,事后监督先对凭证进行有效性审核,审核有不符合