PDF 格式的文件编辑难度非常大,相比 docx 格式它存在的意义是什么?

与其把 PDF 当做一种文档格式,不如把它当做一种电子纸

PDF 的意义,就是电子时代的纸。

任何软件只要愿意,都能打印成 PDF 格式。就像任何软件只要愿意,都能打印在纸上一样。

比如 Photoshop 可以导出为 pdf,但是它能导出 docx 吗?

正因为 PDF 的定位是“纸”,所以它的重点从来就不是可编辑性,而是显示一致性。

就好比,一个文档在不同电脑、不同软件中打开的效果可能不一样,甚至常常出现 A 软件能打开、B 软件打不开的情况。

但是这个文档打印到纸上之后,任何人看到这张纸的效果都一样。

你总不能说,同一张纸,我打印的时候看得见,发给客户他就看不见了吧?

这就是 PDF 格式要实现的目标。

同一个 PDF 文件,用不同的 PDF 阅读器打开,在不同电脑 / 手机、不同操作系统上打开,显示效果都一样。

正是为了不惜一切代价地实现显示一致性,PDF 牺牲了可编辑性。

注意了:不是 PDF 不想做到容易编辑,不是 PDF 故意让你改不了,是为了极致的显示一致性,必须牺牲可编辑性。

PDF 会把文本位置、字体、间距、缩放比例、页边距等等所有属性,全部在文件格式里限定死,让软件没有自由发挥的空间。

为什么不同软硬件打开 PDF 的效果都能一样,本质上就是这个原因。

比如,我在 Word 里打一行“Hello World”,这行字在 docx 文件源码中可能是这样的:

Hello world!

你很容易在源码中找到 hello world 这行字。

但是把这个 docx 导出为 pdf,pdf 的源码是这样的:

BT
1 0 0 1 1036 572 Tm
/TT1 12 Tf
[ (He) 24 (l) -48 (l) -48 (o) ] TJ
ET

翻译成人话:

【文字开始】
缩放比例 1 倍 坐标(1036,572) 【文字定位】
/TT1 12 磅 【选择字体】
[ (He) 间距 24 (l) 间距 -48 (l) 间距 -48 (o) ] 【绘制文字】
【文字结束】

pdf 会手把手地告诉电脑,怎么一点一点把这个文件在屏幕上打印出来,事无巨细。

代价就是,连 Hello 你都找不到,被拆成 He-l-l-o,连每个字母的间距都限定得死死的。

至于 World 在哪?在另一个 BT-ET 区块里。

PDF 难以编辑,这一点很多人都不喜欢。但问题是为什么那么多文件都是 PDF 格式?

只要是网上公开下载的,比如论文,几乎全部都是 PDF,latex、caj 都算小众了。至于下载论文是 docx 格式的,我还从来没遇到过。

原因很简单:因为 PDF 最大程度地确保了,所有人看到这个文件的效果都一样。

想象一下,如果你下载的论文是 docx,会怎么样?

很有可能你一打开就报错,提示 N 个字体找不到。

同一个 docx 文件,明明在 windows 下用 Word 打开好好的,放到 mac 的 Pages 打开就报错【字体找不到】,简直是家常便饭。因为 win 下的字体,mac 不会自带,反之亦然。

而 pdf 为了解决这个问题,极为变态地把所有字体都嵌入到文件中了。

你根本不可能遇到【字体找不到】的报错,因为所有用到的字体都在这个 pdf 文件里面!

当然,也不排除某些发布者恶意不嵌入字体,那你只能灵活安装字体了,否则看到的都是框框……

最后说一点:pdf 的编辑难度非常大不假,但这并不意味着 pdf 不可编辑。

想一想,如果你要把一张纸上的某个文字改掉,你会怎么做?

不要告诉我不可能。

你觉得不可能,只是因为你还没学会“不择手段地前进”。

要改掉一张纸,至少有两种方法:

  • 在原来的位置上涂改(比如用修正液)
  • 拿一张白纸,把原来的纸重抄一份

pdf 同样如此。

当然,改起来很难,代价巨大——但是可以做到。

我在做 pdf 翻译的时候就遇到了这个问题。

一般的翻译都是翻译一段文字,但我要的是翻译一整个文档,比如论文,比如电子书。

自然,绝大多数这样的文档都是 pdf 格式。

而翻译文档本质上就是修改文档,而且还要保证修改后的效果尽可能和原文一样。

目前实现的效果像这样:

PDF 格式的文件编辑难度非常大,相比 docx 格式它存在的意义是什么?
PDF 格式的文件编辑难度非常大,相比 docx 格式它存在的意义是什么?
PDF 格式的文件编辑难度非常大,相比 docx 格式它存在的意义是什么?

只能说差强人意,算是初级阶段吧,距离我的目标还有很长的路要走。

但是坑太深,已经有种肝不动了的感觉……

[新春采购季]京东云 服务器2核2G 51元起/年 点这里优惠购买
[新春采购季]阿里云 服务器2核2G 61元起/年 点这里优惠购买
[新春采购季]腾讯云 云服务器2核2G 61起/年 点这里优惠购买
感谢您的来访,获取更多精彩文章请Ctrl+D收藏本站。
更多精彩文章,请收藏本站
版权声明:本文依据知识共享署名4.0国际许可协议(BY-NC-SA)进行授权。
文章标题:PDF 格式的文件编辑难度非常大,相比 docx 格式它存在的意义是什么?
文章链接:https://app.qiip.cc/5386.html
本文为【软件乐园】原创文章,转载请附上原文链接。
免责声明:根据我国《计算机软件保护条例》第十七条的规定,为了学习和研究软件内含的设计思想和原理,通过安装、显示、传输或者存储软件等方式使用软件的,可以不经软件著作权人许可,不向其支付报酬。本网站特此声明,所有内容资源均来源于网络,仅供用户进行交流、学习与研究之用,若涉及侵权问题,请联系站长进行删除处理。版权归属原版权方所有,本网站不承担任何版权争议。用户下载后,不得将内容用于商业或非法用途,并需在24小时内删除。否则,由此产生的一切后果将由用户自行承担。
THE END
分享
二维码
< <上一篇
下一篇>>