收藏本站 
广告服务 
网站地图 
>> 本频道近100000余篇各类电脑技术、网络技术、软件技术、网页及平面设计等方面的电脑教程,我们的原则:不是精华拒不收录!
先飞电脑技术网技术文章软件教学办公软件
网络编程 | 网站建设 | 网络技术 | 设计教程 | 软件教学 | 程序开发 | 数据库开发 | 教育认证 | 硬件维护 | 媒体动画 | 机械电子 |

图片文件转文本的OCR识别方法

[ 作者:佚名    转贴自:网络转载    阅读次数:94    更新时间:2007-9-16 14:53:00   录入:刘光勇 ]         
    本方法适用于扫描所得的图片型PDF文件的文字识别。

1.工具:microsoft office document imaging(见Office 2003 工具)、Windows程序附件中的“画图”板。

2.图片文件格式:.tif(即Tag图像文件格式,tiff)

3.步骤:

    A.在PDF文件中使用快照工具,选中需要识别的区域。提示“选定的区域已复制到了剪贴板”,点击“确定”。

    B. 打开“画图”板,“开始--程序--附件--画图”,然后点“编辑--粘贴--文件--另存为”,在保存类型中选择Tiff,然后“保存”。

   C.用microsoft office document imaging打开保存的tif文件,“开始--程序--Microsoft office--microsoft office工具--microsoft office document imaging”,接下来有两种方法:1)点“工具--使用OCR识别文本”,然后在运行过OCR的页面上直接复制文字粘贴到Word中即可进行编辑。2)点“工具--将文本发送到Word”,去掉“在输出时保持图片版式不变”前面选择框中的“√”,然后确定,在弹出的Word中选择文字即可进行编辑,识别完成。

  4.注意事项:

   A.PDF原稿越清晰识别效果越好,建议放大到200%使用快照工具。

   B.其他格式图片应先转换为tif格式,用“画图”板打开然后另存就可以。

   C.使用快照工具时选区边界尽量放宽,避免靠边的字无法正确识别。

   D.支持跨栏选择的文字,识别后段落正常。

   E.使用快照工具时,避免一次选择太大范围,造成死机。

   F.如果识别后全为乱码,注意microsoft office document imaging的OCR选项是否为相应语言,“工具--选项--OCR--OCR语言(中英文选择)--确定”。

文章首页【加入到收藏夹】告诉好友】【打印此文】【关闭窗口
  版权声明:本站提供的“图片文件转文本的OCR识别方法”版权归文章所有者,转载请注明出处!
 ·上一篇文章:WPS Office实用自动化技巧四则      ·下一篇文章:更改默认主题 让Office 2007更具个性
相关文章
·利用CSS使图片自适应显示宽度[25]
·网页图片应用CSS的滤镜的效果[31]
·JSP实现数据库中图片的存储与显示[34]
·图片文件转文本的OCR识别方法[94]
·Photoshop为卡通图片添加可爱心形图案[99]
网站主页 | 收藏本页 | 联系我们 | 广告服务 | 站点地图 | 会员注册 | 招聘信息 | 内容指正

联系QQ:先飞电脑技术网站事务联系QQ,点击可以直接留言. 32933427 电话:13710542091 [世界排名] 鄂ICP备05005890号 先飞电脑教程网