ETD 指南/学生/LaTeX 中
如果 ETD 应该存档 20-50 年并仍然可读且可用,那么有必要与 MS Word 的方法一样,使用预定义的 LaTeX 样式表。只有通过标准化 LaTeX 的使用,才能设计出快速且可持续的转换为 XML 的解决方案。由于 LaTeX 主要用于自然科学和数学领域,因此对复杂数学符号、公式和表达式的编码是这种转换的主要问题之一。由于存在数学的 XML 文档类型定义或模式,MathML(参见 http://www.w3.org/math),并且大多数数学软件,如 Maple、Mathematica 等支持导出到 MathML,因此必须将此标准用作 LaTeX 的输出。
LaTeX 格式应该能够更轻松地转换为 XML,因为它采用结构化的文本处理方法。但是,LaTeX 用户的使用习惯倾向于编写复杂的宏包以创建复杂的打印布局,这使得在大多数情况下很难获得结构一致的文档。此外,结构和语法正确性的不可解析性也使得转换更加复杂。
将数学表达式转换为 XML 可以使用三种不同的策略
- 将它们转换为图形,这些图形易于由常见的 Internet
浏览器解释和呈现。这里排除了公式内的搜索或进一步使用。
- 将它们转换为 MathML,
- 将它们保留在 XML 文件中的 LaTeX 编码中。然后像 IBM
Techexplorer 或 Math Viewer 之类的插件能够解释 LaTeX 代码并生成公式和数学表达式的动态渲染。
LaTeX 中的公式编码存在语义差异。因此,作者必须意识到 LaTeX 标记或命令在语义级别和布局级别的差异。
示例
Pi 代表数学常数,它是圆周长与其直径之比,约为 3.141592653。
在 MathML 中编码
<pi>
<apply>
<approx/>
<pi/>
<cn type = "rational">22<sep/>7</cn>
</apply>
这将呈现如下
而不是简单地将其编码为字母 pi,它可能保留为变量的名称
<apply>
<approx/>
<pi/>
<cn type = "rational">22<sep/>7</cn>
</apply>
这将呈现为:pi ≈ 22 / 7
为了从 LaTeX 文档生成 XML 文档,有几种可能性
- TeX4ht 是一种高度可配置的基于 TeX 的创作系统,用于生成超文本。它通过样式文件和后处理器与基于 TeX 的应用程序交互,将源文件的处理留给本机 TeX 编译器。因此,TeX4ht 通常可以处理基于 TeX 的系统的功能,特别是 LaTeX 和 AMS 样式文件的功能。(http://www.cis.ohio-state.edu/~gurari/TeX4ht/mn.html)
- WebEQ:一个基于 Java 的工具集合,用于创作和渲染 MathML,包括一个可视化编辑器、一个 WebTeX 到 MathML 翻译器,以及一个用于在网页上交互式数学的渲染小程序。WebEQ 还为 Java 程序员提供 API 文档和库,用于其他支持 MathML 的应用程序。(http://www.dessci.com/de/features/win/default.stm#TeX 或 http://www.dessci.com/features/win/default.stm#TeX)
有关不同工具的使用方式的更多信息,请参阅
Michael Goosens;Sebastian Rahtz:The LaTeX Web Companion,Addison-Wesley,1999:ISBN 0-201-43311-7
下一节:检查和更正