- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PDF Reference 学习札记(一)
By Regina 梳理
进入 readfree 有一段时间了,看了 coolman、cheming、老马等高手的一些旧贴和他们的宝贝后,大大激发了我的求知欲, 我感到要想成为他们这样的高手,必须从基础开始学起,学习 PDF Reference 就是我迈出的第一步。今天,我第一次来这里发贴,把我学到的东西和大家一起分享,望高手们批评指正。
我模仿了 PDF Reference 的 example 1,用记事本输入下面的文本,并把该文件保存为 Ex001.pdf,它就是一个简单的PDF 文件。
%PDF-1.6
0 obj
/Type /Catalog
/Outlines 2 0 R
/Pages 3 0 R
endobj
0 obj
/Type /Outlines
/Count 0
endobj
0 obj
/Type /Pages
/Kids [ 4 0 R ]
/Count 1
endobj
0 obj
/Type /Page
/Parent 3 0 R
/MediaBox [ 0 0 612 792 ]
/Contents 5 0 R
/Resources /ProcSet 6 0 R
/Font /F1 7 0 R
endobj
0 obj
/Length 73 stream
BT
/F1 28 Tf
100 100 Td
5 Tr
1 0 0 rg
0 0 1 RG
(Hello Word !) ET
endstream endobj
0 obj
[ /PDF /Text ] endobj
0 obj
/Type /Font
/Subtype /Type1
/Name /F1
/BaseFont /Helvetica
/Encoding /MacRomanEncoding
endobj 1062
xref 0 8
0000000000
65535
f
0000000009
00000
n
0000000074
00000
n
0000000120
00000
n
0000000179
00000
n
0000000364
00000
n
0000000466
00000
n
0000000496
00000
n
trailer
/Size 8
/Root 1 0 R
startxref 625
%%EOF
下面,我对上面的文件结构做一些细致的分析。
%PDF-1.6
▲ 这是 PDF 文件头部,“-”后的 1.6 是 PDF 的版本信息。
0 obj
/Type /Catalog
/Outlines 2 0 R
/Pages 3 0 R
endobj
endobj
▲ 这是一个 PDF 中的“对象”,它的特点是:以 obj 开始,以 endobj 结尾。PDF 文档都是以对象为单位组织其结构的。
△ “1 0 obj”中的“1”是对象编号,每个对象的编号是唯一的;“0”是对象的生成号,每当我们修改了 PDF 中的对象时,它会自增 1。
△ 中间的“ ”称为“字典”,里面有许多“键-值”对的描述信息。
△ 其中,“/Type /Catalog”说明了该对象的类型是/Catalog(即“目录”对象),它是 PDF 文档的根对象。
△ “/Type”中除了有“/Catalog(目录对象)”外,还有“/Outlines(书签大纲对象)”、“/Pages (页面组对象)” 以及“页面组对△ 象/Pages”中含有的若干“/Page(页面对象)”等。
△ “2 0 R”和“3 0 R”都是对对象的“间接引用”。“2 0 R”就是在引用“2 0 obj”对象,“3 0 R”就是在引用“3 0 obj”对象。
0 obj
/Type /Outlines
/Count 0
endobj
▲ 这是的一个“/Outlines(书签大纲对象)”。
△ “/Count 0”说明没有此书签个数为 0,即没有书签。(以后我再详细分析)
0 obj
/Type /Pages
/Kids [ 4 0 R ]
/Count 1
endobj
▲ 这是的 PDF 中的“/Pages (页面组对象)”,它有两个主要的选项“/Kids”和“/Count”。
△ “/Kids”说明了这个/Pages 是由哪些/Page 组成的,后面的“[4 0 R]”是一个数组,里面的“4 0 R”就是一个“/Page
(页面对象)”,[]里可以有多个/Page 对象组成。
△ “/Count 1”说明了/Pages 对象里含有/Page 对象的个数,这要与[]中的对象数目一致,这里表明这个 PDF 文件只有一页。
0 obj
/Type /Page
/Parent 3 0 R
文档评论(0)