把pdf中的图片中的文字提取成word
发布网友
发布时间:2022-04-21 04:08
我来回答
共5个回答
热心网友
时间:2022-06-17 22:05
对于是图片做成的PDF(特别是扫描件做成的PDF)文件,要转换成能编辑文本就麻烦多了:
1、页数比较少的用 CAJviewer 7.0.2 (简体中文完整功能绿色版,带OCR组件完整版,需要的就是它),支持直接打开PDF文件,识别文字。
2、页数比较多的可以用 Readiris Corporate v12.0.5702(简体中文特别版)软件来进行识别 (需要安装亚洲语言包,不然不识别中文)
3、页数比较多的还可以用 ABBYY finereader 8或者8以上版本(有汉化版或简体中文版)进行识别转换。这个软件的识别率很高,转换出来的版面基本保持原样。
《ABBYY FineReader pro 8.0.0.706 光学文字识别软件》(ABBYY FineReader OCR 8.0.0.706 Professional Edition)v8.0.0.706 专业汉化版:http://xidong.net/file001/file_43806.html
4、Adobe Acrobat 9.0 professional 简体中文版(注册激活后才能用),使用比较简单,不用下载另外的语言包支持,完整版都在600MB以上,识别率虽然比不上面的,但是效果也是不错的。不要下成那个只能阅读的Adobe Reader9.0版本。
5、使用汉王,转换的识别效率同样很高。
6、Microsoft Office Document Image(Microsoft Office Document Scanning)这是Office自带的一个OCR识别工具,如果你安装Office时,安装了就可使用,没有安装可以从安装光盘安装。但是不建议使用,太麻烦识别率也不高,校对工作量大。如果很少的图片也是可以考虑的。
7、OmniPage Professional v17及以上版本,这个不支持中文(没有东亚语言包),但对英、法、德、意都没有问题。号称是目前世界上辨识率最高、辨识速度最快的辨识软件。
OCR识别软件都不可能百分之百识别图片中的文字!但对英文字符的识别可以达到98%甚至99%,中文字符的识别率一是达不到这么高,二是不同的软件差别也比较大!如果PDF文件版面比较干净,清晰度很好,可以考虑来识别转换。如果你眼睛看着都费劲,那就干脆放弃好了,人还看不出来,就不要想软件能识别出来了。
热心网友
时间:2022-06-17 22:06
可以用汉王 OCR软件转换 官网地址:http://www.hw99.com/
在网页的右下角有一个“汉王 PDF OCR 免费使用”下下来安装好,打开软件--打开图像--选择你的PDF文件,
不过这个做出来的有些字也是错的,需要自己改一下。
热心网友
时间:2022-06-17 22:06
你直接提成图片,然后插入到word里面算了吧。
热心网友
时间:2022-06-17 22:07
哥们,再高的高手也不能完成你的任务,呵呵
热心网友
时间:2022-06-17 22:08
可以, h! 我。