CAT 工具/MemoQ/技巧和窍门
您可能希望定期备份您的资源(项目、翻译记忆库、术语库、设置等),以进行灾难恢复。由于 MemoQ 将资源存储为文件,因此只需复制文件夹或文件即可轻松创建备份。以下说明可帮助您创建备份,以便在资源损坏时可以快速恢复。但是,此方法创建的备份并非用于“长期”使用:尝试恢复在旧版本中创建的备份可能会导致问题。
备份或还原任何文件之前,请确保 MemoQ 未运行。MemoQ 可能会将某些文件保持打开状态,甚至可能正在写入其中一个文件,这可能会阻止成功备份或还原。
您需要备份以下文件夹
- C:\Documents and Settings\All users\Application Data\MemoQ
(在 Windows Vista 中:C:\ProgramData\MemoQ)
- C:\Documents and Settings\(您的用户名)\Application Data\MemoQ
(在 Windows Vista 中:C:\Users\(您的用户名)\AppData\Roaming\MemoQ)
- 我的文档\我的 MemoQ 项目
(以上假设 C:\ 为系统驱动器。)对于项目、翻译记忆库、术语库和过滤器配置,默认存储路径可以在 MemoQ 中的“工具”>“选项”>“外观”>“位置”中更改。如果您已更改了上述任何默认路径,请备份您的新路径。
如果您使用的是服务器解决方案,建议您定期备份包含有关用户、组、权限和项目的信息的 SQL 数据库。默认情况下,它位于以下文件夹中,该文件夹还包含项目文件夹和一些您可能也想备份的配置文件
- C:\Documents and Settings\All Users\Application Data\MemoQ Server
(在 Windows Vista 中:C:\ProgramData\MemoQ Server)
SQL 数据库文件和事务日志分别存储在 MemoQServer.mdf 和 MemoQServer_log.ldf 中。两者都需要成功备份和还原。在服务器安装过程中,您可能已更改了服务器数据库存储的路径。如果您更改了路径,请确保也备份新路径。服务器项目文档存储的文件夹也可以从服务器管理员中更改,因此,如果您未使用默认文件夹,请也备份实际的项目文件夹。
在备份或还原操作之前,您需要停止 MemoQ Server 服务和与 MemoQ Server 相关的 SQL Server 实例的服务(按此顺序)。未能执行此操作可能会阻止您成功完成操作,甚至可能使服务器处于不可用状态。在备份或还原操作后,再次启动 SQL 实例服务和 MemoQ Server 服务(按此顺序)。
如果自备份创建以来您已将服务器升级到更新版本,切勿尝试还原数据库备份。数据库模式通常会在版本之间进行修改,由旧版本创建的数据库可能无法与当前版本的服务器一起使用。如果您需要还原在旧版本的 MemoQ Server 中创建的数据库,则首先需要卸载您当前版本的 MemoQ Server,然后安装创建数据库的版本。之后,您可以还原数据库备份,然后安装当前版本。安装程序将把已还原的数据库升级到当前版本。
通过遵循以上说明,您的备份可能包含 MemoQ 和/或 MemoQ Server 的许可证文件。但是,如果存在频繁的许可证相关更改(例如,您使用的是移动许可证或最近获得了新的许可证),则在还原备份时还原旧版本的许可证文件可能不是一个好主意。在这种情况下,请不要在备份包中包含许可证文件。(或者,如果它们已经备份,请不要还原它们。)许可证文件命名为 LicenseNN.dat(其中 N 是数字,例如 License11.dat、License02.dat 等)。它们可以在以下文件夹中找到
MemoQ
- C:\Documents and Settings\All users\Application Data\MemoQ
(在 Windows Vista 中:C:\ProgramData\MemoQ)
和/或
- C:\Documents and Settings\(您的用户名)\Application Data\MemoQ
(在 Windows Vista 中:C:\Users\(您的用户名)\AppData\Roaming\MemoQ)
MemoQ 服务器
- C:\Documents and Settings\All Users\Application Data\MemoQ Server
(在 Windows Vista 中:C:\ProgramData\MemoQ Server)
如果在还原备份后遇到许可证问题,请先在线更新您的许可证。为此,请单击“帮助”菜单中的“激活”(或“服务器激活”用于服务器),然后单击“在线更新许可证”。如果这不能解决问题,请联系 Kilgray 支持。
任务:如何清除较旧的翻译,在某些情况下,某个段落有多个翻译。
解决方案:这实际上在 MemoQ 中是可能的,使用或不使用一些技巧,具体取决于 TM 的设置。
- 默认情况下,TM 仅允许一个相同源段落的条目;这是您在创建 TM 时可以指定的设置。您还可以配置要保留哪些条目:同样,默认情况下,您提交的最后一个翻译将覆盖之前的翻译。在这种情况下,多个翻译问题从一开始就不存在。
- 如果您的 TM 允许多个翻译并且您想要清除它,也有一个方法。当您打开 TM 进行编辑时,您可以指定筛选/排序条件。如果您按条目日期和时间排序,然后导出到 TMX,则条目将按时间顺序排列。导入回仅允许一个翻译的 TM 将具有以下效果:仅保留最新的翻译。
这可能不是一个非常简单的方法;但同样,也许如果一个人选择允许多个翻译,这也不是您想定期做的事情。
MemoQ 的最新版本(2.1 及更高版本)完全支持 TTX 文件,但对于旧版本,仍然有解决方法可以处理 TTX 文件。以下是操作步骤。
首先,您需要下载一个名为 PlusToyz 的 doc 文件,其中包含 Word 宏,可在 Wordfast Yahoo 群组(文件部分,位于 http://tech.groups.yahoo.com/group/wordfast/files)免费获取。您需要加入该群组才能下载该文件。
使用任何 Web 搜索引擎,您可能会找到几个指向直接下载的链接,但其中 99% 都是该文件的旧版本,因此无法保证结果。
因此,以下是操作步骤:
- 使用 Word 打开 PlusToyz.doc 文件。
- 使用底部宏(TTX 文件转换为 Trados 风格的段落文本)将您的 TTX 文件转换为带 Trados 标记的双语 Word 文档。
- 使用 MemoQ 导入生成的标记 Word 文件,确保将 tw4winMark 添加为排除的样式(确保也选中了 外部 框)。
- 翻译 每个第二个段落,将所有“源”(第一个)段落留空。
- 翻译完成后,并确保所有应有的段落已正确确认,请从 翻译 菜单中选择 将源复制到目标为空处。
- 现在所有段落都已填充,按 CTRL+SHIFT+A 选择所有段落,然后从 翻译 菜单中选择 确认但不更新。
- 现在您有一个完全可导出 doc 文件(以及正确的 TM,没有无用的源=源内容)!
- 导出文档。
- 再次打开 PlusToyz.doc Word 文件。
- 选择 段落文本转换为 TTX 宏,将您的翻译文件转换回 TTX。
- 使用 TagEditor 打开生成的 TTX 文件,您可以看到一个经过正确翻译的文件!
请注意,尽管翻译过程中的拆分/合并操作不应也不一定会改变最终结果,但最好不要过多地使用它,直到我们获得大量可靠的报告证明它不会影响最终的 TTX。
您可以在 MemoQ 的当前版本中直接导入 DOCX 文件。
您可以在 MemoQ 的当前版本中直接导入 .docx 文件。
- 重命名您的 .docx 文件并添加 .zip 后缀。
- 打开新的“zip”文件,您会看到几个文件夹。浏览到 Word 文件夹,只提取 document.xml 文件,其中包含您需要翻译的文档文本。
- 启动 MemoQ 并创建一个新项目。
- 选择 添加文档为,并浏览到 document.xml 文件。
- 在 文档导入设置 对话框中,您将看到已选中的 XML 过滤器。
- 我们现在将为 DOCX 文档创建一个 XML 过滤器。稍后,您只需双击它即可选择它。
- 点击 管理 XML 格式 以显示 XML 格式管理员 对话框。
- 现在选择 创建新格式 选项。
- 为这个全新的自定义 XML 过滤器命名。我们将其命名为 DOCX(Word2007)。
- 确保 从头开始创建 已选中,然后点击确定。
- 在 XML 格式设置 对话框中,点击 添加文件,并浏览到 document.xml 文件。
- 现在选择 标签和属性 选项卡,然后点击 填充。MemoQ 将分析文件并自动创建正确的标记设置。
- 点击 确定。您现在拥有一个正确的 DOCX xml 过滤器。点击 关闭 关闭此窗口。
- 现在您拥有了一个合适的 xml 过滤器,双击自定义 DOCX(Word2007) 过滤器。
- 文件已导入。您现在可以使用 MemoQ 安全地翻译它。
- 翻译完成后,只需导出 document.xml 文件。
- 将 .zip 存档中的旧 document.xml 文件替换为翻译后的文件。
- 重命名文件以删除 .zip 后缀,并恢复以前的 .docx 扩展名。
您现在拥有一个翻译后的 DOCX 文件!
有时,当您的客户使用特定源语言(例如 EN-CA)向您发送 TM 时,您可能会将您的 TTX 文件导入到使用其他区域语言(例如 EN-GB)的项目中,但之后您可能会发现,当您导出生成的 TTX 时,源语言发生了变化!这可能会导致问题,因为 TagEditor 拒绝使用与当前关联的 TM 不同的语言设置来编辑 TTX。
事实上,MemoQ 会将 TTX 文件的源语言和目标语言设置为当前项目中选择的语言。有时您可能想利用这一点,并故意选择您认为合适的源语言和目标语言。
要做到这一点,请执行以下操作:
- 从当前项目中以 MBD(MemoQ 双语文档)格式导出翻译后的 TTX 文件。
- 创建一个使用任何需要的源语言或目标语言的新项目。
这里特别要注意:如果您只选择了“英语”而没有指定区域设置,MemoQ 会默认设置为 EN-US。 - 将您的 MBD 文件导入到这个新项目中。
- 选择所有段落并将源文本复制到目标文本。
- 使用“导出选中内容”或“导出全部”导出这些 TTX 文件。
现在您拥有完全可用的双语 TTX 文件,您可以使用 TagEditor 打开这些文件,并使用您选择的源/目标语言!
MemoQ 没有内置的开关来显示或隐藏空格和其他不可打印字符。您可以通过使用经过特别调整的字体来显示它们。该字体名为 Veronika,由 Endre Both 开发,经作者许可,该字体也可以从 Kilgray 网站上的以下链接获取:
http://kilgray.com/memoq/VeronikaSans.ttf
http://kilgray.com/memoq/VeronikaSerif.ttf
注意:Veronika 字体使用矩形代替扩展的 CEE(中欧和东欧)字符。
Denis Hay 基于 Calibri 创建了类似的字体;这些字体也可以从 Kilgray 网站上获得,经作者许可:
http://kilgray.com/memoq/CALIBRI_MQ.ttf http://kilgray.com/memoq/CALIBRI_MQ2.ttf http://kilgray.com/memoq/CALIBRI_MQ3.ttf
Denis 对这些字体的描述:
Calibri MQ 只添加了一个小三角形字形来显示不间断空格。
Calibri MQ2 还在此基础上添加了一个非常小的点来显示普通空格。与常用的修改字体不同,这个点不会妨碍阅读,但它允许在仔细观察时轻松发现双空格。这是我比较喜欢的字体。
Calibri MQ3 与 MQ2 非常相似,但普通空格的点字形更大,适合那些可能更喜欢这种字形的用户。
要在 MemoQ 中翻译时显示空格,请执行以下步骤:
- 从上面的链接下载字体。
- 转到 控制面板 / 字体,然后从 文件 菜单中选择 安装新字体...。
- 浏览到保存字体的文件夹,从顶部的列表中选择它们,然后点击确定。
- 在 MemoQ 中,打开 工具 / 选项,然后转到 外观、位置 类别。在 字体系列 下拉列表中,选择任何新安装的字体。
MemoQ 现在将在翻译网格中显示每个空格字符的小圆点。
虽然这不是一个记录的功能,但 MemoQ 可以输入不间断空格,例如在法语引号中很有用。要输入不间断空格,请按 ctrl+shift+空格,而不是空格。
对于某些 Word 文档,MemoQ 将显示多余的标签,这些标签显然没有用处。导入文档后,无法删除这些标签;您能做的最好的就是按 F8 插入它们,或者通过按 Alt+F8 将它们放在目标段落的末尾。
有几种可能的方法可以在导入之前减少这些标签:
- 选择整个文档并设置正确的语言。
- 接受所有更改。
- 关闭修订。
- 关闭智能标签。
- 选择整个文档并设置字符间距 - 比例 100%;间距:正常;位置:正常。
- 另存为 Open Office,然后保存回 Word(这可能会导致某些格式丢失)。
- 将 doc 另存为 Word 6.0/95(这可能会导致某些格式丢失)。
- 使用 TRADOS 进行段落分割并清理。
这些方法和其他方法在此处讨论:http://www.necco.ca/dv/word.htm#Rogue_codes
我已将这些导入前提示和其他一些提示自动化到一个带有自定义工具栏的 Word 模板中(CodeZapper_2.3)。此模板还包含一些其他导入前和导入后处理宏,这些宏可能会有用。它主要是为了与 Deja Vu 一起使用而设计的,但 MemoQ 用户在某些情况下也可能会发现它有用。您可以在文件部分找到它 (http://tech.groups.yahoo.com/group/MemoQ/files/)。Dave Turner
Jim Wardell 关于消除恶意代码的更多想法::
如果 Word 文件在 MemoQ 中导致恶意代码,请在导入之前预先编辑它们,寻找 Dave 提到的问题。此外:
确保整个 Word 文件中已停用自动连字。
使用查找和替换功能删除所有可选连字符。
确保 Word 设置“对大写字母进行连字”已关闭。
有时,当源 PDF 文本中的字号在两个整数字号之间徘徊时,就会出现错误代码。OCR 输出(甚至允许半点字号)然后可能包含嵌入的字号更改(例如 11 pt. --> 11.5 pt. --> 11 pt --> 10.5 pt.)。如果您遇到很多这种情况,并且 Word 文件本身包含多个您希望保留的字号,您可能需要逐一选择连续的字号段落,并应用您希望使用的字号(例如,在上述情况下,可能是 Arial 11 pt.)。一种更简洁、更专业的做法是将样式定义应用于此类段落。您的样式定义还应包括“不自动换行”和“正常字符间距”。
如果您的源文档不包含粗体或斜体,请选择整个文件并将所有内容更改为粗体+斜体。然后再次选择整个文件,并删除粗体和斜体。
如果您使用 OCR 软件扫描 PDF 文件(因此是您最初创建错误代码的人!),请仔细查看从 OCR 导出到 Word 时生效的详细设置选项。只使用您需要的设置,其他设置可能会生成错误代码。
Arial Unicode 字体由 OmniPage 安装。OmniPage 在 Word 文件中插入了围绕变音符号的标记。我通过从系统中删除 Arial Unicode 字体解决了这个问题。使用 OCR 软件时,最好使用字体匹配来限制 OCR 输出中允许的字体,例如,限制为 Times New Roman 和 Arial。
如果您的客户主动为您转换 PDF 文件为 Word,请考虑他/她可能正在使用廉价的 PDF 转换器程序来执行此操作,并且可能对自己的操作一无所知。在这种情况下,您最好自己获取 PDF 文件,并使用高质量的 OCR 软件自行进行转换。请注意,即使是最好的 PDF 转换器也比专业品质的 OCR 软件更容易导致错误代码和格式问题。一分钱一分货。在减少错误代码和生成 TM 友好格式方面,两款领先的专业级 OCR 程序之间也存在重大差异。仔细测试两者,看看哪一个在您的情况下提供更 TM 友好的结果。
Dave 和我提供的建议应该可以帮助您消除几乎所有错误代码,但是如果您仍然遇到太多错误代码,请打开 MQ 并注意给定错误代码发生的位置,然后在 Word 中同时打开有问题的文件。尝试选择有问题的周围字符,并检查任何设置更改。如果您学到了一些有用的东西,请注册为 Wikibooks 作者并将其添加到此页面。
对我们(一家游戏公司)有效的一个建议是,通过简单地使用正则表达式 </?rpr[^>]*> 删除特定类型的这些标记,在查找和替换中启用正则表达式,启用源替换,以及在复选框中启用标签内的查找和替换。在 99% 的 docx 文档中,这些文档充满了过多的标记,这解决了问题,而不会对格式或质量造成任何明显的影响。这也适用于具有类似问题的 Excel 文件。最好在之后进行测试导出,以查看是否破坏了任何内容,但通常情况下,这毫无问题地奏效。因此,是的,您确实可以在导入后使用一些查找和替换来删除它们!
在“翻译结果”中禁用大小写转换
[edit | edit source]对于某些语言,您可能希望在“翻译结果”窗格中禁用大小写转换。
- "工具" > "选项" > "TM 默认值,用户信息"
- 禁用“切换所有替换”
过滤掉不需要的语言
[edit | edit source]在项目配置期间滚动浏览语言列表很繁琐。在未来的版本中,Kilgray 可能会让 MemoQ 记住最近使用的语言列表,并在列表顶部显示这些语言。
同时,用户可以使用以下简单步骤(基于 Gregory 在 <http://tech.groups.yahoo.com/group/MemoQ2/message/291> 中的建议)消除不需要的语言。
如果您没有 XML 编辑器,可以从这里下载免费的 XML Marker 软件:<http://symbolclick.com/>
打开 XML Marker 并打开 LangInfo.xml 文件。该文件很可能位于“C:\Documents and Settings\All Users\Application Data\MemoQ”中,或者可能在其他位置,具体取决于您的安装选项。
注意:在 Windows 7 中,该文件可能位于“C:\ProgramData\MemoQ”中。这一点很重要,因为 Windows 搜索通常 (?) 不会在此特殊隐藏的系统文件夹中查找文件。--Drawdenrubdarb (discuss • contribs) 08:14, 15 May 2012 (UTC)
在 XML Marker 中,突出显示您不需要的语言代码,右键单击并选择“注释掉选择”。一旦所有不需要的语言都被注释掉,保存该文件,然后幸福地生活在一起 :-)
--HerbEppel 15:49, 17 November 2007 (UTC)
减少从包含图像的 DOC 格式转换的 RTF 文件的大小
[edit | edit source]MemoQ 不支持 DOC 文件,而是在导入过程中,它使用您的 Microsoft® Office™ Word 应用程序将您的文件从 DOC 格式转换为富文本格式 (RTF)。当 DOC 文件包含图像时,这些图像将被转换为无用但巨大的 Windows 元文件。这确保了与 ANCIENT 文本编辑器的兼容性,但对您毫无用处。实际上,一个简单的公司徽标可以将一封简短的信件的大小从 20 KB 扩展到 1,200 KB(或 1.2 MB)。而且这是在您开始添加文本之前。解决方案是对每台机器上的 WORD 注册表进行简单的更改。要防止 Word 在您的 RTF 文件中保存图像的两个副本,请执行以下操作
- 关闭 Word(如果它正在运行)。
- 单击“开始”>“运行”。将出现“运行”对话框。
- 在“打开”框中,键入 regedit 并单击“确定”。将打开注册表编辑器。
- 导航到 HKEY_CURRENT_USER > Software > Microsoft > Office > Version > Word > Options。(将 Version 替换为您使用的 Word 版本。)
- 在窗口的右侧窗格中,右键单击并选择“新建”>“字符串值”。将创建一个名为“新建值 #1”的新字符串。
- 将该值重命名为 ExportPictureWithMetafile。(要执行此操作,您可以从快捷菜单中选择“重命名”。)
- 更改名称后,右键单击该字符串并选择“修改”。将出现“编辑字符串”对话框。
- 在“数值数据”框中,输入 0。
- 单击“确定”。
此方法在以下位置进行了讨论:<http://hotdocstips.bashasys.info/index.php/hotdocs/automation/correcting_bloated_images_in_rtf_templates/>
在同一台计算机上使用 MemoQ 明信片软件和 MemoQ Translator Pro(完整版)
[edit | edit source]如果您想使用 MemoQ 2.0,但同时在同一台计算机上安装 MemoQ 的完整版或试用版,请执行以下操作
- 安装 MemoQ 2.0。
- 将 C:\Program Files\Kilgray\MemoQ 下的所有内容复制到另一个文件夹中,并创建一个指向 MemoQ.exe 的快捷方式。
- 安装 MemoQ Translator Pro。
现在您可以同时使用这两个程序 - 但请确保使用不同的资源。
避免在将大块文本从源复制到目标时出现卡顿
[edit | edit source]如果您想在翻译过程中将大块文本从源复制到目标,MemoQ 目前可能会卡住或崩溃,如果质量保证模块在后台运行。
转到主设置区域中的“项目 QA 设置”,并确保标签上方的所有复选框都没有被选中。等到您真正到了真正想要开始进行质量保证检查的时候,再真正开始运行 QA 功能。
使用自动可翻译项进行数字格式转换
[edit | edit source]除了其他功能外,MemoQ 中的自动翻译功能可以用来将数字从一种语言格式转换为另一种。例如,英语使用逗号作为千位分隔符,使用句号作为小数分隔符。意大利语则相反。设置好正确的自动翻译规则后,MemoQ 会在源段落中提供数字的“本地化”版本。这些本地化的数字会显示在翻译结果列表中。这些自动翻译的匹配项可以像翻译记忆库或术语库中的匹配项一样快速插入到翻译中。自动翻译功能也用于片段组装功能。
自动翻译规则可以在项目级别(在项目的设置页面)或全局级别设置,适用于具有相同源语言和目标语言的所有项目(在工具菜单 > 选项 > 自动翻译中)。
以下是将英语翻译成上述语言(以及其他可能语言)的项目所需的规则。该规则将本地化包含小数分隔符或千位分隔符(而不是两者都包含)的数字。规则需要按以下顺序输入,以确保其正常工作。有关输入自动翻译规则的信息,请参阅 MemoQ 帮助主题中的“语言特定设置 > 自动翻译”。
规则 1(将 1.234 更改为 1,234)
自动翻译规则
(\d+)\.(\d+)
替换顺序规则
$1,$2
说明:如果数字序列后面跟着一个句号和另一个数字序列,则此规则会将句号替换为逗号。
规则 2(将 12,345,678 更改为 12.345.678)
自动翻译规则
([\d]{1,3}),?(\d\d\d),?(\d\d\d)
替换顺序规则
$1.$2.$3
说明:如果由 1 到 3 位数字组成的序列后面跟着一个逗号,然后是三位数字,另一个逗号,再是三位数字,则该规则会将逗号替换为句号。
规则 3(将 12,345 更改为 12.345)
自动翻译规则
([\d]{2,3}),?(\d\d\d)
替换顺序规则
$1.$2
说明:如果由 2 到 3 位数字组成的序列后面跟着一个逗号,然后是三位数字,则该规则会将逗号替换为句号。