首页 > word > word

把PDF图片中的文字提取出来变Word文字的两种快速方法

时间:2017-11-06   作者:snow   来源:Office之家

前言:在实际工作中,当需要把图片中的文字抠出来时,如果一个个的看着图敲字,工作量真不是一般的大,今天推荐一篇图片转文字的教程。

法一:用office自带的onenote工具

想把图片转化成文字,首先需要一张含文字的图片(该图片可以是你平常手机照的图片,不过想让计算机能够更好的识别就需照片越清晰越好),下面将以从网上截的“我爱北京天安门”为列。个人使用的是office2013版,office2003版后都自带有onenote,对于2003版之前的用户可以使用法二。

步骤一 打开office自带的onenote工具。具体如图一所示,打开后界面如图二所示。


图一 打开onenote工具


图二 onenote打开界面

步骤二: 点击图二所指箭头(即新建一分区)

步骤三: 插入你要转化为文字的图片。插入à图片。具体如图三所示,插入后的界面如图四所示


图三  插入图片


图四插入后界面

步骤四:处理(把图片转化为文字)。鼠标选中图片,右键单击à选中复制图片中的文本,然后把鼠标放在空白处,右键单击,保留原格式粘贴即可,处理后的结果如图六所示。


图五  处理方式图


图六处理后的结果

法二:用CAJViewer

工具:CAJViewer。其中文名为CAJ全文阅览器,其与超星阅览器类似,是一种电子图书阅览器,其支持CAJ、PDH等,具体如图一所示


图一 CAJ全文阅览器支持格式图

特点:可把PDF转化为文字,常提取论文中的文字。识别时最好一段一段的识别,方便个人核对与更改

步骤一:下载CAJ软件

链接: https://pan.baidu.com/s/1o80wUKy

密码: x4yg

安装:若电脑中已经安装则跳转至步骤二

(1)右键单击下载好的软件---打开,默认下一步,当出现界面更改路径界面时,点击浏览,根据个人所需更改,具体如图二所示,这里我以放入D盘CAJ文件中为列。

        


图二 选择安装路径

(2)选择安装类型。一般安装典型即可,具体如图三所示。之后默认下一步即可。


图三 选择安装类型

步骤二:打开一论文或者把图片转化为pdf格式

把图片转化为pdf格式:打开pptà插入图片à另存为pdf格式。如图四所示


图四把图片格式转换为PDF格式

步骤三:用CAJ打开刚另存为的PDF格式的文件。具体如图五所示

  


图五用CAJ打开要识别的文件

步骤四:处理,点击文字识别按钮à然后框中你要识别的内容,然后把内容复制到剪贴板,然后粘贴至个人想放的地方或者发送到WPS或者word中即可。具体如图六、图七所示


图六  选中文字识别


图七

除了软件外,图片转文字还有很多好用的在线转换工具,比如百度自已的OCR在线工具(https://cloud.baidu.com/product/ocr/general)识别率相当的高。

对大家关心的表格式图片转换成Excel,小编曾试了很多软件,识别率都不太高。免费的软件中,相比汉王OCR软件(百度可以搜到下载地址)转换表格效果还不错,小编一直在用

发表评论