原因:
PDF转WORD的时候是先读取内嵌的字体,如果内嵌的字体没有,那么再读取你系统中的字体来显示,然而WORD文件是直接读取系统中的字体的,那么如果你PDF文件中内嵌的某个或者某些字体在你的操作系统中没有,那么转换出来的word文件一般都会出现乱码。
处理办法:
绝大多数转化软件都有局限性,再加上本身文档的特点,一般不能完全解决乱码、错字、格局紊乱等现象。选择尽可能识别度高的软件如ABBYY finereader。
转化识别存在着一定的错误率,这个和被识别文件的清晰度,分辨率有关系,文件分辨率高,清晰度好,准确率就高,反之,准确率就低。因此无论选择那一款转化工具,最终一定要仔细核对文档。
汉王Pdf_Converter能很快而且准确地将PDF文件转换成用Word打开的RTF文件,并且是免费版的,下载网址http://xiazai.zol.com.cn/detail/33/326858.shtml
如果全是扫描图片或乱码,则用雪莹DocConvert将原文输出为jpg格式,再用汉王文豪7600进行识别
如果不是图片类做成的PDF 你可以转换成WORD格式后进行编辑, 但是如果是内嵌了字体的,那么就要看情况了,因为有的字体你系统里面有,转出来就没有问题,如果系统里面没有,那么转出来就是一堆乱码;一些用户为了避免别人转换,特意引入了一些特殊字体,复制和转换出来都是乱码。对于是图片和没有字体(乱码)做成的PDF文件,那么我们就需要用OCR类软件进行识别了,软件有:清华紫光OCR;尚书七号;Leadtools OCR;赛酷OCR;汉王文豪7600(图形OCR识别成WORD或EXCEL);汉王HW_PDF_OCR_81(推荐:PDF文件、图形,OCR识别成WORD或EXCEL);ABBYY FineReader(推荐)
我用汉王HW_PDF_OCR_81,可在汉王官方网站 主页右下角有免费的正版下载,下载地址www.hw99.com/
不明白时,在百度Hi中联系,我为许多同学转换过各种(加密的、图形的、乱码的)PDF文件。
推荐使用悦书PDF在线转换:http://pdftoword.cqttech.com/,文字识别更强大,解决常见乱码或格式问题(请在电脑上访问,不支持手机上打开)。