把pdf中的图片中的文字提取成word

发布网友发布时间：2022-04-21 04:08

共5个回答

热心网友时间：2022-06-17 22:05

对于是图片做成的PDF（特别是扫描件做成的PDF）文件，要转换成能编辑文本就麻烦多了：
1、页数比较少的用 CAJviewer 7.0.2 （简体中文完整功能绿色版，带OCR组件完整版，需要的就是它），支持直接打开PDF文件，识别文字。
2、页数比较多的可以用 Readiris Corporate v12.0.5702（简体中文特别版）软件来进行识别（需要安装亚洲语言包，不然不识别中文）
3、页数比较多的还可以用 ABBYY finereader 8或者8以上版本（有汉化版或简体中文版）进行识别转换。这个软件的识别率很高，转换出来的版面基本保持原样。
《ABBYY FineReader pro 8.0.0.706 光学文字识别软件》(ABBYY FineReader OCR 8.0.0.706 Professional Edition)v8.0.0.706 专业汉化版：http://xidong.net/file001/file_43806.html
4、Adobe Acrobat 9.0 professional 简体中文版(注册激活后才能用)，使用比较简单，不用下载另外的语言包支持，完整版都在600MB以上，识别率虽然比不上面的，但是效果也是不错的。不要下成那个只能阅读的Adobe Reader9.0版本。
5、使用汉王，转换的识别效率同样很高。
6、Microsoft Office Document Image（Microsoft Office Document Scanning）这是Office自带的一个OCR识别工具，如果你安装Office时，安装了就可使用，没有安装可以从安装光盘安装。但是不建议使用，太麻烦识别率也不高，校对工作量大。如果很少的图片也是可以考虑的。
7、OmniPage Professional v17及以上版本，这个不支持中文（没有东亚语言包），但对英、法、德、意都没有问题。号称是目前世界上辨识率最高、辨识速度最快的辨识软件。

OCR识别软件都不可能百分之百识别图片中的文字！但对英文字符的识别可以达到98%甚至99%，中文字符的识别率一是达不到这么高，二是不同的软件差别也比较大！如果PDF文件版面比较干净，清晰度很好，可以考虑来识别转换。如果你眼睛看着都费劲，那就干脆放弃好了，人还看不出来，就不要想软件能识别出来了。

热心网友时间：2022-06-17 22:06

可以用汉王 OCR软件转换官网地址：http://www.hw99.com/

在网页的右下角有一个“汉王 PDF OCR 免费使用”下下来安装好，打开软件--打开图像--选择你的PDF文件，

不过这个做出来的有些字也是错的，需要自己改一下。

热心网友时间：2022-06-17 22:06

你直接提成图片，然后插入到word里面算了吧。

热心网友时间：2022-06-17 22:07

哥们，再高的高手也不能完成你的任务，呵呵

热心网友时间：2022-06-17 22:08

可以， h! 我。