看看下面这些问题,也就是您遇到的问题,看上去似乎是知云软件故障,但是却是PDF文件本身的问题,因为知云只是负责将从PDF中复制出来的文字翻译出来。这些问题是有解决方法的,本文章提供的就是解决方案。

因为pdf文件和word不同。PDF文件当初设计的目的是为了让不同电脑显示出来的画面相同,因此内部代码是可能乱七八糟的,有些PDF甚至可能是图片转换而来,根本无法选中文字。目前大家阅读的文献大部分都是正常的,只有少数会出现这样的问题。
您总会遇到这样的问题,因此强烈推荐收藏这篇文章。


现象举例

1、用文本工具根本无法选中pdf上的文字。


image



2、复制段落右侧原文/翻译乱码。乱码可能是问号,也可能是其他。


image



3、下面这个pdf选中时把前面行号也选中了,而且文本乱码。


image



4、大部分分栏的pdf都可以正常选中单栏的文本,但这个pdf尽然这样横向选中两栏,导致翻译的是混乱的。


image



5、选中段落后右侧原文中单词之间的空格没有。有时候不是全部,而是某句话或某段话。这样也会导致翻译失败。


image

除了上述列举的,还可能有其他情况。


解决方法:

使用OCR软件通过OCR识别的方式修复这些PDF文件。这样可以完全修复上面这些有问题的PDF。修复好之后再用知云文献翻译阅读翻译。


什么是OCR?


OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。因此OCR不是一个软件,而是一个技术,基于OCR原理的软件有很多,经过反复比较,咱们最推荐的是使用万兴PDF专家专业版。


软件使用方法:


万兴PDF专家专业版,是小编经过多款软件对比后觉得最好用的OCR软件。而且有win版本和mac版本。由于对科研工作者来说PDF文件是长期会用到的,遇到不标准的pdf是长期大概率事件。因此安装一个软件十分有必要。


由于版权原因,我们不提供破解版。请自行百度搜索或者购买正版均可。也可以自己搜索其他ocr软件。


1、安装好后打开这款OCR软件(万兴PDF专家)。并用它打开问题pdf文件。image


2、然后,看下图点击“转换-OCR”。注意首次使用可能提示下载OCR组件,您点击确定下载即可。


image


3、确保选择正确的OCR语言,建议看下图这样选择比较通用。imageimage


4、点击这个保存按钮,把OCR好的PDF保存到电脑中。


image


5、用知云打开OCR修复好的PDF文件进行阅读翻译。


image


除了ocr功能外,还可直接编辑PDF文件。功能十分强大。对于长期使用阅读PDF文件的您来说,一定能长期使用到。


由于版权原因,我们不提供破解版。请自行百度搜索或者购买正版均可。也可以自己搜索其他ocr软件。