跳转到内容

CAT 工具/DéjàVu X/日语

来自维基教科书,自由的教科书

错误 (特定语言:日语作为源语言)

1. 扫描功能 (Ctrl+S)

添加: --Loek van Kooten 2007 年 2 月 5 日 18:19 (UTC)

版本 7.0.284

系统: Windows XP SP2

描述: 扫描功能(在其他 CAT 工具中也称为一致性)无法可靠地工作。日语源文本中的词语并不总是能找到。尚未建立任何模式。

复制

解决方法


状态

Atril 尚未阅读。


其他用户的评论

2. 找到的部分窗口

添加: --Loek van Kooten 2007 年 2 月 5 日 18:19 (UTC)<

版本 7.0.284

系统: Windows XP SP2

描述: 如果日语源词语前面或后面有标点符号 (、。),则它们不会出现在“找到的部分”窗口中。

复制

解决方法


状态

Atril 尚未阅读。


其他用户的评论

3. 自动传播

添加: --Loek van Kooten 2007 年 2 月 5 日 18:19 (UTC)<

版本 7.0.284

系统: Windows XP SP2

描述: DVX 会因日语翻译中的数字转换问题而感到困惑,因此会直接复制自动传播字符串的数字,而不会实际检查自动传播的“副本”中的数字是否等于自动传播的“原始”中的数字。

示例

平成 19 年 2 月 2 日 (平成 19 年 2 月 2 日) 翻译为 2007 年 2 月 2 日

平成 19 年 1 月 1 日 (平成 19 年 1 月 1 日) 自动传播为 2007 年 2 月 2 日(应该是 2007 年 1 月 1 日)

虽然 DVX 无法为自动传播的副本生成正确的翻译是可以理解的,但危险在于 DVX 将副本标记为自动传播,而实际上源文本是不同的。关闭自动传播是另一个极端,因为它也会取消对原本会正确传播的字符串的自动传播。

解决方案:如果 a) 源文本为日语,并且 b) 自动传播的副本中的数字不等于自动传播的原始文本中的数字,则 DVX 不应自动传播字符串。复制:

解决方法


状态

Atril 尚未阅读。


其他用户的评论

4. 从 Microsoft Word 导入

添加: --Loek van Kooten 2007 年 2 月 6 日 15:54 (UTC)

版本 7.0.284

系统: Windows XP SP2

描述: 从日语 Word 文档导入后,DVX 中的文本充斥着恶意代码。日语通常包含汉字 (kanji) 和罗马字母/阿拉伯数字。由于日语字体中标准的罗马字母/阿拉伯数字非常难看,大多数日语 Word 文本使用两种不同的字体(一种用于汉字,另一种用于罗马字母/阿拉伯数字),并且不断交替使用。每次交替都会产生一个恶意代码。

问题在于,如果目标文本是西方语言,那么这些恶意代码毫无意义,因为目标文本不会包含汉字,因此用一种字体书写(用于罗马字母/阿拉伯数字的字体)。也就是说,这些恶意代码在目标文本中是完全多余的,会减慢翻译过程并污染数据库。

因此,从日语翻译到西方语言时,DVX 应该忽略所有字体更改,而选择标准字体(如 Arial,甚至可能是用户定义的字体)。自动识别日语源文本中使用的字体似乎非常复杂,因为“字体集”(包含日语和罗马字体)可能被使用并且“配对”不一致。

似乎许多恶意代码实际上不是由交替字体引起的,而是由交替代码集引起的,因为即使是强制使用一种字体的 Word 文档也会在 DVX 中产生不一致的恶意代码

{\loch\af25\hich\af25\dbch\af25 \loch\af25\hich\af25\dbch\f25 平成}{\loch\af25\hich\af25\dbch\af25 \hich\af25\dbch\af25\loch\f25 18 年 12 月 19 日}

而不是仅仅 平成 18 年 12 月 19 日

恶意代码是不一致的:如果代码出现在 平成 (日语从汉字变为阿拉伯数字) 后面,你会期望在 年、月 或 日 后面出现类似的代码,但事实并非如此。复制:

解决方法


状态

Atril 尚未阅读。


其他用户的评论

华夏公益教科书