引用: led2015 发表于 2020-7-17 23:17 有时去百度,总会发现文库里好多扫描版,现在图片都能提取文字了,为啥不能改成文字呢
经常看到一些扫描版的PDF文件,里边的文字是可以复制的,你知道这是怎么实现的吗?
引用: littleshrimp 发表于 2020-7-18 07:43 经常看到一些扫描版的PDF文件,里边的文字是可以复制的,你知道这是怎么实现的吗?
现在的扫描软件都支持文字识别,生成PDF文件时可以按文字+图像混排,能识别的就自动转成文字,不能识别的依然为图像。近期扫描的书籍大多如此,全篇图像格式的基本上都是多年前的扫描版本,当初的文字识别支持率不高。
引用: chunyang 发表于 2020-8-14 20:24 现在的扫描软件都支持文字识别,生成PDF文件时可以按文字+图像混排,能识别的就自动转成文字,不能识别的 ...
明白了 原来是扫描软件的功能