问:我使用扫描仪的OCR功能实现一些印刷文字资料的识别,但识别率一直不太理想,请问应该如何做才能提高OCR的识别率?
答:OCR是一种印刷文字识别软件,它只能识别印刷体的原稿。影响OCR识别率的因素很多,较主要是扫描后图像质量的好坏,河南扫描仪租赁,如果出现黑边框、混杂有图形表格、文字歪斜等都会使OCR识别错误率大增,甚至无法进行。一般OCR要求识别的文稿以黑白模式(Line/art)、300dpi或更高的分辨率扫描。如果扫描时使用的分辨率太低,也会造成文字识别率下降。
当用户需要扫描厚度较大的杂志时,若直接扫描,扫描仪租赁厂家,难免会发生内文因无法完全摊开而导致部分文字不清晰及扭曲失真的情况,这样的结果是OCR软件无法正确识别的,大大降低识别率。怎么办呢?用户不妨在扫描前,将图书拆成一页页的单张,然后再进行扫描。对于一般的报纸,由于本身即是单张形式,因此不存在上述问题,但由于报纸面积通常较大,扫描仪租赁哪家好,无法一次扫描,因此预扫时事先框选扫描范围,一次扫描一块区域,这样的辨识效果会大大提高。