选择合适的文档格式/文本文件
在大多数类型的组织中,文本文件是除财务报表之外最重要的电子信息类型。根据文档的内容,有多种格式可供选择。
有三种类型的文本文件:纯文本文件 - 纯文本,没有格式,没有字体选择。文本文件 - 可以选择字体、颜色、文本大小、背景和嵌入图像(声音/视频等)。演示文稿文件 - 包含文本文件的所有选项,但对进一步编辑有限制。
对于纯文本文件,最简单、最持久的格式是ASCII(美国信息交换标准代码)。它自 1963 年以来一直在发展,并且一定是历史上支持率最高的单一格式。然而,它也很有限。唯一可用的格式是换行符的选择。没有嵌入任何图像或颜色,也不支持变音符号或非拉丁文字。有许多其他基于 ASCII 的编码,它们增加了对更多字符的支持。在西方世界,windows-1252(与 ISO-8859-1 密切相关)是最常见的编码。世界其他地区将有其他约定。UTF-8 可以表示所有实际使用的语言的文本,并且正变得越来越普遍,可能是长期存储文本的最佳选择。
使用基于 ASCII 的编码的文本文件通常以 .txt 后缀表示,但很难自动确定使用哪种编码。因此,最好尝试找出您正在使用的编码并记录下来。如果您真的担心,您可能还想找到并存储将该编码转换为 unicode 的权威表格(尝试 http://www.iana.org/assignments/character-sets 和 http://www.unicode.org/Public/MAPPINGS/)。
对于 Windows 用户,记事本是处理 TXT 文件的默认应用程序。当前版本的记事本假设如果文件是完全有效的 UTF-8 或具有 UTF-8 字节顺序标记,则为 UTF-8;如果检测到 UTF-16 字节顺序标记,则为 UTF-16;否则为 Windows ANSI 代码页(西方版本的 1252)。在紧急情况下,通常可以使用记事本和类似的编辑器从其他类型的文件中获取原始文本,并且尝试对您计划存储的其他文件执行此操作可能是有益的。
文本文件是您在许多商业或免费文字处理程序上大部分时间产生的文件。大多数情况下,您可能使用它来编写基本的文本文件。写给朋友和同事的信件、项目列表等等。这种类型文本的应用程序可以在流行的办公套件中找到,例如Microsoft Office、AppleWorks 和 OpenOffice.org。
为了保证文档的持久性,重要的是您今天编写的文档明年仍然可以阅读。很长一段时间以来,没有针对文档的开放标准,因此兼容性一直是一个持续的问题。当人们选择从一个文档编辑器迁移到另一个文档编辑器时,他们取得了不同程度的成功,因为每个编辑器都使用自己的格式。.doc 格式现在得到了多个编辑器的良好支持。
无论您使用哪种文字处理程序,它都应该支持多种格式,选择最持久的格式非常重要。虽然 开放文档 标准 (Version 1.0 于 2005 年 5 月被批准为 OASIS 标准) 正在进行,但 RTF (Rich Text Format) 是最广泛支持和记录的格式。您应该能够将其设置为默认格式,以便所有将来的文档都以 RTF 格式存储。(教程关于在 Microsoft Word 中更改默认格式)如果您选择不这样做,因为 RTF 不支持您需要的某些功能,您仍然应该考虑将 RTF 作为您的存档格式。您的格式可能无法正确显示,但至少您的内容会为后人保留下来。
如果您花时间制作演示文稿文件,您就会知道文字处理程序在这方面是有限的。您可能正在使用 Adobe Illustrator/InDesign、sodipodi 或 CorelDRAW 等程序。这些程序很棒,但存档它们可能会很棘手。
至少有两种竞争选项,来自 Adobe 的 PDF,尤其是 PDF/A,以及来自 Microsoft 的 XPS。
便携式文档格式 (PDF) 是 Adobe Systems 于 1993 年创建的文件格式,用于文档交换。PDF 是一种固定版式格式,用于以独立于应用程序软件、硬件和操作系统的形式表示二维文档。每个 PDF 文件都封装了二维文档的完整描述(以及 Acrobat 3-D 中的嵌入式三维文档),其中包括构成文档的文本、字体、图像和二维矢量图形。PDF 是一种开放标准,已于 2008 年 7 月 1 日由 ISO 正式发布为 ISO 32000-1:2008。 "便携式文档格式 (PDF)" 维基百科在线百科全书,访问日期:2008 年 7 月 4 日
PDF/A 在 ISO 19005-1:2005 文档管理 - 用于长期保存的电子文档文件格式 - 第 1 部分:PDF 1.4 的使用 (PDF/A-1) 中进行了描述,该标准于 2005 年 10 月 1 日发布。该标准定义了一种用于长期存档电子文档的格式 (PDF/A),它基于 Adobe Systems Inc. 的 PDF 参考版本 1.4(在 Adobe Acrobat 5 中实现)。PDF/A 事实上是 PDF 的一个子集,它省略了不适合长期存档的 PDF 功能。这类似于为印刷和图形艺术定义的 PDF/X 子集。 "PDF/A" 维基百科在线百科全书,访问日期:2008 年 7 月 4 日
XML 纸张规范 (XPS),以前代号为“Metro”,是微软开发的一种页面描述语言和固定文档格式的规范。它是一种基于 XML(更准确地说,基于 XAML)的规范,基于新的打印路径和基于颜色的矢量文档格式,支持设备独立性和分辨率独立性。 "XML 纸张规范 (XPS)" 维基百科在线百科全书,访问日期:2008 年 7 月 4 日
使用 PDF 文件时需要注意的一点:不要使用 PDF 文件的内置压缩,如果可能,请使用 PDF 1.4 规范。
建议
- 尽可能使用纯 ASCII 文本
- 在格式很重要或需要包含图形时使用 ODT
- 对于将来不需要编辑的文档,使用 PDF 或 XPS
参考资料
- 开放文档 在维基百科