⑴尚书七号(尚书号)虽一款专门用于扫描件文字识别软件,它可以轻松的把图片中的文字识别并提限出来,方便用户对文字进行入录修改保存,形成电子文档,是信息化时代数字保存的好工具,无论是书籍报刊还是报表票据公文档案都可以用尚书七号录入,只需将纸质文档扫描,即可在尚书七号中将扫描的图片中的文字提取出来,形成电子档以便存档,软件还提供了多种字体的识别,比如宋体仿宋楷黑魏碑隶书圆体行楷等,识别出来后还可以自动拆分无需人工操作,省时省力。
⑵目前,许多信息资料需要转化成电子文档以便于各种应用及管理,但因信息数字化处理的方式落后,不但费时费力,而且资金耗费巨大,造成了大量文档资料的积压,因此急需一种快速高效的软件系统来满足这种海量录入需求。
⑶用扫描仪扫描的文字图像,不能对个别文字进行编辑修改,在教学中,需要利用文字识别软件,将文字图像进行识别,将图像格式转化成文本格式,常见的文字识别软件有很多,主要功能基本相同。尚书七号就是其中很优秀的一款。
⑷尚书七号OCR软件是MICROTEK中晶科技公司,向汉王科技购买授权,赠送给用户使用的软件,适用于个人小型图书馆小型档案馆小型企业进行大规模文档输入图书翻印大量资料电子化的软件系统。
⑸.识别字符:简体字符集:国标GB-的全部一二级汉字多个。纯英文字符集。 简繁字集:除了简体汉字外,还可以混识台湾繁体字多个以及香港繁体字和GBK汉字。
⑹.识别字体种类:能识别宋体仿宋楷黑魏碑隶书圆体行楷等一百多种字体,并支持多种字体混排。
⑺.识别字号:初号 小六号字体。
⑻.表格识别:可以自动判断拆分识别和还原各种通用型印刷体表格。
⑼.尚书七号ocr可支持繁体WINDOWS系统
⑽首先把图片保存成分辨率以上(别再低了的jpg图片,tif好像也可以。
⑾在尚书七号软件中打开图片,点击放大或者缩小调整好画面大小,然后选择区域,点击“识别”——“开始识别”,确定好后输出就可以了!
⑿尚书号OCR界面简洁大气,能扫描图片或直接打开已有的图片进行文字识别提取,功能不少,有剪刀放大缩小等,能节省资料录入需要的大量人力物力。
⒀.从本站下载后解压,双击Setup.exe开始安装。
⒁.修改安装地址,点击下一步。
⒂.安装完成,从开始菜单启动尚书七号OCR。
⒃用尚书七号对文字图像识别转化的过程,利用其主菜单:“文件”“编辑”“识别”“输出”可以很方便地完成。
⒄.获取文字图像文件
⒅选择“文件”菜单下的“扫描”或“打开图像”(将已经扫描好的图像文件打开命令,打开图像文件。如果连接了多台扫描仪,可以选择“文件”菜单下的“选择扫描仪”命令,调用扫描仪。
⒆.对扫描的图像页进行调整
⒇选择“编辑”菜单下“图像页面的处理”子菜单下的“图像页的倾斜校正”(提供自动和手动实现方法及“旋转”等命令,将扫描的图像页进行调整。
⒈.版面分析与文字识别转化
⒉版面分析,选择识别范围,在进行文字识别前要选择识别范围,识别过程的核心是“版面分析”。
⒊尚书七号的自动版面分析功能很强,对报纸杂志等复杂的版面,也能保持很高的分析正确率。
⒋设置好后,直接点击“开始识别”的按钮就可以进行文字识别了。
⒌自动识别完毕,识别结果的“文本窗口”会弹出,这个窗口能够提供识别结果的校对,为了校对方便,尚书七号增加了光标跟随显示原图像行的校对方法。
⒍提供的校对方法,一眼就能够看到图像原文和识别出文本的差别,如果发现识别有误,可以进行修改。
⒎如果检查修改后确认无误,选择识别结果的“输出”菜单,输出的文件格式有:RTFHTMLXLS,可以根据自己的需要选择对应的格式。
⒏如果用户想得到类似原文的识别结果,请选择RTF格式。把RTF格式输出的文件用WORD打开后,会发现几乎保留了原文的所有痕迹,包括原来页面中的彩色图像,都已经保留在WORD中了。