大致了解了这个过程具体就是个图片文字识别,用不了这么复杂,福昕企业版就能识别,专业点叫做orc ,汉王orc可以直接识别图片,一般纯文字的适合,图片要清晰,识别后文字格式会出现混乱楼下说的abbyy最专业,但是安装和激活比较麻烦,不过识别率最高,试用版,每次只能识别一页如果转成pdf 也可以用adobe acrobat 专业版 非常给力,国产的就是福昕阅读器企业版,激活要容易一点 ,转换效率比较高,但是格式会出现混乱,纯文字基本无影响
先dopdf ~~然后~~用abbyy