How to edit pdf: Difference between revisions
Line 31: | Line 31: | ||
|} | |} | ||
在高清屏上,能看出左边 CEP 处理过的书页更清晰: | |||
[[File:左边 | [[File:左边 CEP 处理过的明显更清晰01.png|600px]] | ||
[[File:左边 | [[File:左边 CEP 处理过的明显更清晰02.png|600px]] | ||
[[File:左边 CEP 处理过的噪点更少.png|600px]] | |||
== 文字化 == | == 文字化 == |
Revision as of 13:05, 5 June 2025
PDF 全称 Portable Document Format,它的诞生是为了方便携带、统一体验,它做到了。几乎所有平台上的 PDF 阅读体验都是一致的。PDF 的方便,使 PDF 得以流行。
猫鼠游戏
需求是第一动力,越来越多的用户,渴望找到某个电子资料的 PDF 版本。盗版机构和个人顺势而动,扫描了海量 PDF 文档。原文档发布机构也顺势而动,发布了海量的低糊 PDF,用以分散盗版用户的精力,吸引他们购买正版。由于扫描技术落后,以及发布者多数只为引流而非纯粹分享,PDF 文件的最大特点摆上了台面:低糊。质量低、画面糊。在盗版带来流量、盗版影响收入这两种现实情况下,用户、盗版者、版权所有者,打响了一场有趣的攻防战。
本文记述 PDF 处理过程中,种种有用的软件使用经验。
重点强调:没有实打实的资金支持,版权所有者后续就没有资本继续为用户提供优质作品。号召所有有能力的用户,购买正版,支持原创机构和作者。同时,号召原创机构和作者顺应时代,不要拘泥于纸质版,多提供一种 PDF 电子版供用户选择,用户与作者可以双赢。
高清化
方案 | 功能 | 打分 |
---|---|---|
Comic Enhancer Pro + PDFPathcer | 曲线 | 100 |
扫描全能王 | 智能高清 | 85 |
WPS | 打印增强 | 60 |
Acrobat Distiller | 高质量打印 | 50 |
在高清屏上,能看出左边 CEP 处理过的书页更清晰:
文字化
双层 PDF
所谓的双层 PDF,就是在不便复制的 PDF 页面上,通过文字识别功能,产生一层文字层,那样,PDF 就能复制文字了。招投标行业常见。也很有用。
这涉及一个 PDF 文字化的问题。
首先,效果最好的是 Adobe Acrobat Pro,但是正版贵。
其次,MinerU 对多页文档效果很好,免费。未来最有前景。
再次,Umi-OCR 最实用,想识别哪里,就截哪里。可以一次识别几百张图片,也可以在后台运行,框选+粘贴就行,很方便。微信截图文字识别,你框选后还得点一次“提取文字”的符号,而 Umi-OCR 不必,可以设置框选后自动识别加复制到剪切板,框选完毕立刻就能粘贴,比微信少了一个步骤。
最后,PDFPatcher 也非常好用,不过要安装两个补丁,技术盲用户闹不懂。
终上,不需要全篇的场合,选 UmiOCR。需要全篇的场合,用 MinerU。不止 PDF 可以这样处理,图片也可以这样处理。如果文字需要在原 PDF 叠加显示,PDFPatcher 最方便。
转 DOCX
最好用的是扫描全能王的会员功能。
该会员功能可以在拼多多、闲鱼购买三天或七天会员,也可以购买教育会员资格。
去水印
- PDFCommander。
- WPS 会员版不堪一用。
- PitStop Pro 收费。
页面增删
- 若先前选了 PDFPatcher,就不用选别的了。
- PDF24 就很方便,既能免费用网页版,也能下载 exe 版本。