新闻资讯 | 控件产品 | 技术文章 | 购物车 | 合作伙伴 | 问题解答 | 电子简报 | PDF论坛 | 资源下载
您现在的位置:技术文章>解决方案 首页|PDF应用篇|PDF开发篇|解决方案

用 PDFlib 创建 PDF/A

发布日期:2007-2-9 作者:pdflib 出处:http://www.pdflib.com

ISO 19005 标准规定的 PDF/A 格式旨在提供一种一致、可靠的 PDF,可以被长期安全地存档,或用来在企业及政府环境内进行可靠的数据交换。本白皮书介绍了用来创建适合于长期文档存档的 PDF/A 输出的 PDFlib 功能。
PDF/A-1a 和 PDF/A-1b PDF/A 的正式名称为 ISO 19005 国际标准,旨在实现数字文档的长期、可靠的保存。此标准基于 PDF 1.4,它对颜色、字体、注释和其他元素的使用有所限制。
PDF/A-1 有两种风格,且均可使用 PDFlib 创建和处理:
> ISO 19005-1 等级 B 规范 (PDF/A-1b) 确保文档的可视化外观可以得到长期保持。简而言之, PDF/A-1b 确保文档在将来某个时候进行处理时,看起来仍然一样。
> ISO 19005-1 等级 A 规范 (PDF/A-1a) 基于等级 B,但添加了“标签 PDF”中的一些关键属性:它要求结构信息和可靠的文本语义,以便保存文档的逻辑结构和自然阅读顺序。简而言之,PDF/A-1a 不仅确保文档在未来使用时保持外观的一致,还确保其内容(语义)能够得到可靠的解释,并可以被有功能障碍的人士读取。

下文中提到 PDF/A (不带任何规范等级)时,指同时包括这两种规范等级。在 PDFlib、PDFlib+PDI 和 PDFlib Personalization Server (PPS) 中的 PDF/A 实现基于 ISO 19005-1 标准及 2007 勘误表。
PDF/A 要求和限制 PDF/A 要求必备某些 PDF 功能,同时禁止某些其他属性。例如,为了保证文本的准确再现,必需嵌入文档中所用的全部字体;为了保证颜色的准确再现,必须以设备无关的方式指定全部颜色。元数据必须使用 XMP 格式嵌入,且不得加密。
但除了这些直接的要求外,PDF/A 还隐含要求具备许多其他 PDF 功能(例如,字体数据结构中的某些项),并禁止使用某些关键结构(例如,某些 TrueType 字体与编码组合)。
软件开发人员在推出完全符合标准的 PDF/A 产品之前,必须实现许多方面的功能,经过一道道检查。PDF/A 决不是简单的“PDF 加嵌入字体”!

PDFlib 产品套件中的 PDF/A 支持 PDFlib 为应用程序开发人员提供了一个工具箱,可用来
执行以下 PDF/A 相关操作:
> 从头创建 PDF/A (例如基于数据库中的文本)
> 将光栅图像(例如扫描图像)转换成 PDF/A
> 处理现有 PDF/A 文档(例如合并或拆分 PDF 文档)
> 创建带结构信息的 PDF/A-1a (标签 PDF)
所有这些操作均可通过简单的 PDFlib 函数调用来实现。PDFlib 分发中还提供了各种编程语言和开发环境的示例代码。对于图片艺术行业来说,在 PDF/A 和 PDF/X 标准 (ISO 15930) 之间明显存在重叠,因此 PDFlib 中的 PDF/A 支持受益于我们多年来对各种风格的 PDF/X 的支持。

创建符合 PDF/A 标准的输出 可通过以下方法,使用 PDFlib 创建符合 PDF/A 标准的输出:
> PDFlib 将自动完成几种正式的 PDF/A 设置,如 PDF 版本号和必需的 XMP 规范项等。
> PDFlib 客户端程序必须明确使用某些函数调用和选项(例如,对于字体嵌入)。
> PDFlib 客户端程序不能使用某些函数调用和选项设置(例如加密)。
如果 PDFlib 客户端程序遵守这些规则,即可保证得到有效的 PDF/A 输出。如果 PDFlib 检测到违反 PDF/A 创建规则的情况,它将抛出异常,应用程序必须对其进行处理。只要存在错误,就不会创建 PDF 输出,因此不存在发生错误而创建了不符合规范的输出的危险。有关必备和禁止的操作的详细信息将在 PDFlib 文档中讨论。
轻松输出设备无关颜色 为了保持颜色再现的一致性,PDF/A 要求使用设备无关颜色,通常通过 ICC 色彩特征描述文件或 CIE Lab 颜色规范实现。可选的输出方法说明了文档的颜色特征。尽管这些概念在图片艺术行业中广为使用,但企业 PDF 开发人员不一定熟悉颜色管理概念。在这种情况下,PDFlib 使得设备无关输出的创建过程变得轻松,无需考虑输入数据的
来源 :
> 无论是否带有输出方法 ICC 色彩特征描述文件,均可创建 PDF/A 输出。
> 在遇到常用的黑色文本时, PDFlib 将根据是否已指定 ICC 输出方法色彩特征描述文件,
自动选择合适的颜色空间(Lab 或 DeviceGray)。
> 通过外部 ICC 色彩特征描述文件和图像中已嵌入的描述文件可以精确控制颜色。
> 在 PDFlib 分发中随附了用于常见应用场合的 ICC 色彩特征描述文件,因此可以快速实现有效的 PDF/A 输出。
光栅图像(例如, TIFF 和 JPEG)在文档创建过程中占有重要地位。文档工作流中光栅图像数据的常见示例包括扫描的纸质文档和数码相机中照片。尽管在现代工作流中光栅图像可能已经变得设备无关(通常是通过嵌入的 ICC 色彩特征描述文件),因而与 PDF/A 兼容,但在许多情况下,旧有的图像数据却是设备相关的,例如无任何 ICC 色彩特征描述文件的黑白或 RGB 扫描图像等。PDFlib 支持以下两种情况:

> 光栅图像文件中嵌入的 ICC 色彩特征描述文件将被接受。
> 外部 ICC 色彩特征描述文件可以应用于图像。
> 作为一种针对未知来源的旧有数据的备用解决方案, PDFlib 包含了一个内置 sRGB 描述文件。
> 通过指定输出方法 ICC 色彩特征描述文件,无需对图像应用 ICC 色彩特征描述文件即可使用设备相关的图像数据。
PDFlib 文档中讨论了常见应用场合下的 PDF/A 颜色策略。
轻松处理 XMP PDF/A 强制要求使用 XMP 元数据来存储有关 PDF 本身内部文档的信息。
XMP 为存储标准和自定义元数据提供了一个强大而灵活的框架。如果您在工作流中已经使用了 XMP 元数据,您可以创建完整的 XMP 流,以便 PDFlib 集成到 PDF/A 输出中。但是,不熟悉 XMP 的开发人员则没有必要深入了解这一主题。PDFlib 将创建 PDF/A 所需的 XMP输出,并自动将纯文本的旧文档信息字段映射到对应的 XMP 结构。结果,愿意这样做的开发人员可以利用 XMP 的强大功能,同时对于简单元数据要求的情况, PDFlib 的 XMP 自动生成功能已经足够应对。

处理现有 PDF/A 文档 从现有符合 PDF/A 标准的文档中导出页面时,还应遵守其他规则。
例如,在 Adobe Acrobat 中,很容易出现合并两个 PDF/A 文档而导致产生的输出文档不再符合 PDF/A 标准的情况(并且无任何警告)。处理现有 PDF/A 文档时, PDFlib+PDI 将仔细检查所有输入和输出文档的PDF/A 属性,以确保输出仍然符合 PDF/A 标准。为进行附加控制,可将导入文档的输出方法复制到输出 PDF,从而有效地克隆现有文档的 PDF/A 颜色
属性。

创建带标签 PDF 的 PDF/A-1a PDF/A-1a 可以被视为 PDF/A-1b 加上 Tagged PDF:它要求提供文档的结构信息,并对字体施加某些条件限制,以确保文本能够得到准确的解释。结果,PDF/A-1a 文档完全能够被有功能障碍的用户读取。除了可视化外观以外,这些文档还保留了其内容的含义。
PDFlib 对 PDF/A-1a 的支持基于生成标签 PDF 的功能:每个内容项可被置于文档结构树内的特定位置,可以将与文档结构无关的内容项(例如,页眉和页脚、分页)标记为伪像,这表示在重利用文档时(例如,在软件朗读文档或将其转换成其他格式时) ,它们将被忽略。图像上可以附加替代文本,视觉有障碍的用户可以通过 Acrobat 阅读这些文本。
注意,要创建标签 PDF,您必须对文档的逻辑结构有详细的了解。PDFlib 将维护与 PDF相关的详细信息,但它无法从文档的内容推断出其结构。
在 PDFlib 6 中已经引入了标签 PDF 支持。PDFlib 7 对这一功能进行了扩充,以便在文档的结构树中包含注释,这改善了链接和其他交互元素的可访问性。
在现有的标签 PDF 支持的基础上,PDFlib 7 能够生成符合 PDF/A-1a 标准的输出。这使得PDFlib 成为第一款支持这一高等级 PDF/A 的工具。
验证 PDF/A  在实现基于标准的工作流时,最佳的做法是使用一些标准校验工具对结果进行验证。对于 PDF/A 标准,已有一些软件工具可以检查指定的 PDF 文档是否符合 ISO 标准。
在 Acrobat 7 中包含的 Preflight 工具为 PDF/A-1b 提供了测试描述文件。但是,由于Acrobat 7.0 早于 PDF/A 的 ISO 标准发行,这一版本仅实现了 PDF/A 的一个草案版本。从Acrobat 7.07 起, Preflight 插件开始支持正式发布的 PDF/A 标准。不过,它在几个地方偏离了 PDF/A 标准,因此仍然存在一些问题。PDFlib GmbH 曾经同 Acrobat Preflight 插件的开发人员一起仔细审查了几起声称 PDFlib 输出不符合PDF/A 标准的案例,并确认这些输出实际上符合标准。Preflight 将在未来版本中修正有关不符合 PDF/A 标准的不适当信息。
同样,我们与其他 PDF/A 验证工具厂商积极协作以确保创建者和验证者对 PDF/A 标准有一个共同的理解和解释。

PDF/A Competence Center (PDF/A 资格中心) PDFlib GmbH 是 PDF/A Competence Center 的核心成员,并积极参与其活动以提高 PDF/A 的行业认知并实现和众多厂家的兼容。有关更多详细信息,参见 www.pdfa.org

发布人:管理员 【报告错误】·【推荐好友】·【打印文章】
相关评论 本文现有 0 条评论 评分人数: 0 平均分: 0
相关评论
用户名: 密  码:
说明:输入正确的用户名和密码才能参与评论。如果您不是本站会员,你可以注册为本站会员。
注意:文章中的链接、内容等需要修改的错误,请用报告错误,以利文档及时修改。
注意:请不要在评论中含与内容无关的广告链接,违者封ID
文章搜索
推荐文章
浅谈PDF与按需印刷
实现后台文件自动转换加密的解决
法律专业人士解决方案
营销专业人士解决方案
AEC(设计、工程、施工)解决
制造业解决方案
热门点击
PDF智能表单及其在企业解决方(8389)
PDFlib 应用案例(7359)
Adobe安全电子文档应用案例(7041)
Adobe安全电子文档应用案例(6724)
用 PDFlib 创建 PDF(6217)
Adobe安全电子文档应用案例(6190)
Adobe智能文档平台(5815)
IT-Doc搭建OA办公高速路(5519)
基于PDF表单的技术与企业业务(5460)
希望文档安全管理解决方案(5132)
热门评论
PDFlib 应用案例(0)
分段加密为数字出版保驾护航(0)
基于PDF的文件评审管理系统(0)
浅谈PDF与按需印刷(0)
希望文档安全管理解决方案(0)
用 PDFlib 创建 PDF(0)
数字出版与跨媒体解决方案(0)
Adobe智能文档平台(0)
实现后台文件自动转换加密的解决(0)
基于DRM技术的学位论文版权保(0)