维基百科是如何运作的/第15章
到目前为止,我们主要关注的是英语版本的维基百科,但维基百科已经创建了超过280种语言版本,每个版本都代表着其独特的社区和内容集合。一个普遍的假设是其他语言的维基百科文章基本上是从英语翻译而来,但这完全是误导:这些网站都创建了自己的内容,翻译只扮演着次要的角色。总的来说,维基媒体项目是当今互联网上最全面的多语言和全球化项目之一。[32]
英语维基百科是规模最大的网站,但其他语言的维基百科也相当庞大:七个其他语言版本的维基百科拥有超过百万篇文章。这些非常活跃的网站通常具有较高的增长速度并在技术上具有创新性。如果您访问http://wikipedia.org/(图15.1,“Wikipedia.org门户页面,显示所有语言”),您会发现它充当了通往其他语言版本维基百科的入口。
在本章中,我们将探讨维基百科的全球化意义,它现在是一个真正国际化且互联的项目。其他语言的维基百科是什么样的,以及如何参与其中?我们还将讨论与英语维基百科相关的语言问题,包括显示外语字符、从全球视角撰写主题以及添加指向维基百科其他语言版本的链接。
[32] Byte Level Research每年发布一份全球化报告卡,该报告卡经常将维基百科评为全球第二大“公司如何成功地为国际市场开发网站”的平台,仅次于谷歌。请参阅http://bytelevel.com/news/reportcard2008.html。
项目的早期目标之一就是使维基百科成为多语言的;吉米·威尔士在2001年初首次提出创建德语版本的维基百科。到2001年5月,也就是英语维基百科成立几个月后,加泰罗尼亚语、中文、德语、法语、希伯来语、意大利语、西班牙语、日语、俄语、葡萄牙语和世界语版本的维基百科相继启动。
正如下面“语言的长尾”中所述,新的语言版本仍在不断增加。截至2013年中期,最大的维基百科是英语版(420万篇文章)、荷兰语版和德语版(各160万篇文章)、法语版(140万篇文章)、瑞典语版(120万篇文章)以及意大利语版、西班牙语版和俄语版(各100万篇文章)。然而,规模本身不应成为衡量重要性的唯一标准。例如,中文维基百科经常引起媒体关注,部分原因是中国政府继续部分限制中国境内访问该网站(作为所谓的“中国防火墙”的一部分)。尽管如此,中文维基百科仍拥有超过71万篇文章,这些文章很大一部分是由台湾、香港和东亚以外地区的众多中文编辑撰写的。
维基百科至少有46个语言版本拥有超过10万篇文章,119个语言版本拥有超过1万篇文章。当一个维基百科达到1万篇文章时,它通常会形成一致的方法、自我更新的社区以及基本政策结构。其余的网站才刚刚起步,只有少量文章和活跃的贡献者,正如下一节所解释的那样。
维基百科以其乐观的态度,启动了许多语言版本的维基百科,但目前这些版本只有几百篇文章。这些网站发挥什么作用?没有人能称它们为全面的百科全书资源。事实是,它们只是刚刚起步的维基——就像2001年或2002年的英语维基百科一样。如果您确实精通其中一种语言,能够做出贡献,那么参与一个较小的维基百科会非常有趣。您会发现一个小网站的用户文化与拥有众多习俗、规则和(显然)更多已编写文章的庞大英语维基百科截然不同。即使在小型维基百科上,文章在很大程度上也不是翻译而来,而是用特定语言新撰写的。
图15.1. Wikipedia.org门户页面,显示所有语言
有时,其他语言的维基百科规模较小,是因为它们非常新,或者是因为说这种语言的人不多,因此潜在的贡献者群体很小。或者,维基百科可能存在于使用广泛但互联网普及率不高的语言中,例如泰卢固语,它是印度次大陆上第三大使用语言,也是全球前十五大使用语言之一(图15.2,“2008年4月泰卢固语版维基百科首页”显示了泰卢固语版维基百科的首页)。这些语言可能没有强大的书面传统,或者在大多数母语使用者居住的地区,互联网接入可能有限。其中一些维基百科很可能构成了其语言最大的在线语料库;无论如何,它们都代表了在线语言,其他人可以轻松地找到它。
图15.2. 2008年4月泰卢固语版维基百科首页http://te.wikipedia.org
维基百科所涵盖的语言范围非常广。维基百科存在于人工语言(具有国际主义目标的世界语[eo]和沃拉普克语[vo])以及重要的已死语言(拉丁语[la]和古教会斯拉夫语[cu])中,这些语言没有母语使用者。[33](这两个字母的代码是语言标识符代码,在第2节“语言之间的链接”中的“语言之间的链接”中进行了说明)。当少数母语使用者存活时,语言保存问题并不是维基媒体基金会的明确目标。但另一方面,为世界上所有的人提供免费信息,无论其语言如何,绝对是基金会的目标,许多较小的维基百科代表了该语言唯一的在线参考作品。在某些情况下,维基百科可能是特定语言中唯一的百科全书!尽管存在这种多样性,但维基媒体已经支持的250多种语言远远不能代表世界上所有活跃的语言。SIL是《民族语》(一种语言标准参考书)的创建者,也是语言识别ISO标准的维护者之一,它认为世界语言总数接近5000种。
因此,新的语言版本仍在不断被提出和启动。这是如何运作的?关键要求是您可以提供潜在活跃用户群的证据。新的维基百科将需要活跃的志愿者来提供内容并监视维基以防止垃圾邮件和破坏。维基百科有一个启动新语言项目的程序,所有新的请求都必须由网站开发人员批准,他们可以创建该项目。第17章“基金会和项目协调”中讨论的维基媒体维基Meta有一个专门的页面用于提出这些请求。请求提交后,新语言版本委员会或langcom将审查该请求。精通该语言的人员必须承诺为新项目翻译Mediawiki界面(包括选项卡、按钮和关键页面的文本)。您可以在http://incubator.wikimedia.org/上查看(并参与)翻译过程中的某些新项目。
- 克林贡语战争
克林贡语维基百科(使用科幻作品《星际迷航》中克林贡种族使用的语言)存在于2004年至2005年。经过一番争论,吉米·威尔士决定关闭该网站,并在2005年维基迷大会上当场实施了该决定。正如Meta上的克林贡语维基百科历史页面所述,“克林贡语项目的存续存在争议,并引发了关于公平性和与其他语言,特别是与其他人工语言的同等地位的长期辩论……克林贡语词汇封闭且不完整,这限制了工作。”内容最终被转移到Wikia于2006年12月在klingon.wikia.com上托管的新网站,截至2008年7月,该网站有161篇文章。/>。
即使您对所讨论的语言只有最基本的了解,在其他语言的维基百科上进行编辑也可能很有趣且有价值。所有维基百科都使用相同的MediaWiki引擎,因此按钮、导航链接和图标的功能都相同,无论其标签是什么。
一种帮助的方式是在小型维基上观看内容。只需记得定期查看慢速增长的维基上的近期更改,你就可以帮助将垃圾邮件和质量差的贡献降到最低。要采用一个维基,你只需要对维基百科的标准足够熟悉,以便识别出肯定无用的更改。查看新的编辑将帮助你指导新的编辑到多语言元页面,并识别出优秀的新的编辑。wikipedia-L 邮件列表用于讨论任何语言中的一般维基百科相关问题。
目前,你必须为每个你想要参与的新语言项目创建一个账户。随着 2008 年年中引入单用户登录(有时称为统一登录)这一情况正在发生变化,用户可以使用它在所有维基媒体项目之间关联其现有账户(更多信息请参见第 1 节“维基共享资源”中的“项目账户和单用户登录”)。但是,所有维基百科都应该允许匿名编辑,如果你只想进行一些更改,这可能会更容易。如果你在未登录的情况下进行编辑,请注意当你尝试保存时出现的强制预览:点击你认为必须是“显示预览”按钮的按钮。
在其他语言中添加编辑摘要怎么样?项目对此可能会有所不同。例如,波兰语维基百科强制要求编辑摘要;否则,除非你登录,否则你将无法保存。在葡萄牙语维基百科上,如果你未登录,则必须在保存编辑之前填写一个验证码框。如果你准备好了这些偶尔的额外手续,那么用其他语言编辑维基百科实际上非常容易。
请记住,不同语言社区的政策、指南和社区实践可能存在很大差异。尽管一些基本原则(例如中立的观点、礼貌和 GFDL 许可证)是所有维基媒体项目的基础,但程序的执行方式由项目社区决定。你经常会发现,较小的项目规则和指南较少,并且讨论往往比那些受到更多外部关注的较大项目更具思考性。
随着各种语言的出现,也出现了各种书写系统:希腊语、西里尔字母、阿拉伯语、希伯来语、表意文字和其他不太熟悉的文字。即使使用基本罗马字母的语言也可能使用重音符号和其他变音符号。例如,各种类型的文字也被用于并集成到维基百科的英语版本中,以提供专有名词的原始形式。图 15.3,“英语版维基百科关于圣雄甘地的文章的第一段,其中使用了三种不同文字的语言(英语、梵语和古吉拉特语),以及 IPA 符号”展示了文章w:莫罕达斯·卡拉姆昌德·甘地中的一个例子,该文章在导言部分使用了古吉拉特语和梵语文字以及 IPA 发音符号。
- 大使馆
- 你可以在维基百科:本地大使馆找到一个会说各种语言并参与英语维基百科,并且愿意帮助解答其他语言问题的用户列表。此页面是大使馆系统的一部分,每个维基百科上都有一个专门的地方供说其他语言的访问者使用。描述了特定语言的维基百科,访问者可以提出问题或请求帮助。你可以在http://meta.wikimedia.org/wiki/Wikimedia_Embassy找到所有大使馆的列表。此列表包含指向每个大使馆的链接,以及该维基百科上会说其他语言并愿意提供帮助的贡献者的姓名。
如果你没有安装必要的字体,这些文字中的任何一个都可能无法在你的网页浏览器中正确显示。如果你正在查看你没有字体支持的文本,你可能会看到小方块或问号而不是正确的字符。如果是这种情况,你需要下载并安装正确的字体。w:帮助:多语言支持收集了有关字体支持的信息和一些建议。此页面有一个图表,你可以在其中比较一些常见的有问题的字体(例如东亚字符集)的图像和你电脑上看到的图像。Firefox 网页浏览器提供了相对较好的多语言支持,大多数较新的操作系统(包括 Windows Vista)也是如此。
图 15.3。英语版维基百科关于圣雄甘地的文章的第一段,其中使用了三种不同文字的语言(英语、梵语和古吉拉特语),以及 IPA 符号
操作系统的语言支持当然仍然受到发达国家需求的驱动,这意味着许多不太常用的文字,例如一些印度语的文字,通常不会被你的浏览器或操作系统原生支持。通常需要下载的字符集包括母语的字符集。要查找这些字体,该语言的维基百科版本可能是一个很好的资源;使用非拉丁文字的维基百科通常有一个帮助页面,关于从其主页链接到获取查看它们所需字体的地址。例如,要在切罗基语文章中看到切罗基语母语文字的正确渲染,你必须下载一个特殊的字体;切罗基语维基百科上的帮助页面http://chr.wikipedia.org/详细介绍了如何查找合适的字体。
在撰写文章时,如果你没有带有你需要字符的键盘,你会发现许多类型的文字,例如西里尔字母和汉字,可以从其他文档中成功复制并保存到维基百科页面上。(这是因为使用了 Unicode 字符编码或w:UTF-8。)大多数操作系统,包括 Windows、Mac OS X 和许多 Linux 发行版,也允许你虚拟地更改键盘布局,以便你可以直接用另一种语言打字。例如,在 Windows XP 中,你可以通过“控制面板”下的“区域和语言选项”来执行此操作。w:帮助:多语言支持(印度语)页面提供了在多个操作系统上输入印度语字符的完整说明;这些说明也适用于其他字符集。
- 显示象形文字
- 如果需要,你可以在维基百科文章中显示埃及象形文字!请参阅帮助:WikiHiero 语法以了解这种基于图像的特殊字体;要使用它,只需将要显示的字符的代码括在<hiero>和</hiero>标签之间即可。
最后,主编辑窗口下方的编辑框(在第 1.1 节“理解编辑窗口”的“理解编辑窗口”中进行了描述)可以轻松访问许多带重音符号和变音符号的字符,以及希腊字母、西里尔字母和 IPA 字母表。只需点击其中一个字符即可将其插入文章中。
- 进一步阅读
- http://wikipedia.org 维基百科所有语言版本的入口
- http://stats.wikimedia.org/ 统计网站提供了每个语言项目中文章和用户数量的信息
- http://meta.wikimedia.org/wiki/Wikimedia_Embassy 语言之间的大使馆系统
- http://incubator.wikimedia.org 新语言维基百科的启动地
- http://meta.wikimedia.org/wiki/Requests_for_new_languages 请求新语言版本的页面
- http://www.ethnologue.com/ 世界语言的百科全书资源
- http://en.wikipedia.org/wiki/Help:Multilingual_support 多语言脚本支持的帮助
[33] “Veni, Vidi, Wiki: 拉丁语在‘Vicipaedia’上并没有消亡”(华尔街日报,2007 年 9 月 29 日);请参阅http://online.wsj.com/public/article/SB119103413731143589.html。
维基间链接或语言间链接是指到维基百科另一个语言版本中关于同一主题的文章的链接。这些特殊链接显示在左侧边栏的“语言”下,如第 3 章“查找维基百科的内容”(第 2.2 节“无所不在的侧边栏”中的“无所不在的侧边栏”)中首次提到。这些指向其他语言维基百科的链接显示在语言的本机拼写下(例如 Français),并按该语言的二字母或三字母代码排序(例如 fr 或 ja)。点击链接将带你到其他语言维基百科中的相应文章。
任何页面,不仅仅是文章,都可以进行维基间链接。例如,如果你在俄语和英语中都有一个用户页面,你可以在你的英语用户页面上添加一个指向你的俄语页面的维基间链接,反之亦然。许多帮助和社区页面存在于多种语言中,并以这种方式相互链接。如果你想在另一种语言中找到等效的项目或策略,这些链接非常有用;例如,如果你想找到德语口语文章,只需转到英语口语维基百科项目,该项目有一个指向德语维基百科页面的维基间链接,WikiProjekt Gesprochene Wikipedia。
编辑们必须逐篇文章添加其他语言的链接,才能显示这些链接。链接是使用特殊的语言代码创建的。这些代码大多是两个字母(少数是三个字母),并且基于国际标准ISO 639,该标准对语言进行了编目。如果不存在 ISO 代码,则会开发和使用一个特殊的代码;例如,简易英语维基百科(用更简单的英语编写的维基百科)使用前缀 simple(根据w:Wikipedia:Multilingual coordination)。这些前缀也出现在每个版本的维基百科 URL 中:因此http://en.wikipedia.org/ 是英语维基百科。可以在元维基站点上的meta:List of Wikipedias找到所有现有维基百科语言及其对应代码的表格。这些代码在项目中也非正式地用于指代各种语言的维基百科;您可能会看到 en:WP 或 enWP 用于表示英语维基百科,de:WP 用于表示德语维基百科,ru:WP 用于表示俄语维基百科,等等。
找到您希望链接的两篇文章并了解其各自的标题和语言代码后,创建链接就非常简单了。编辑其中一篇文章,然后滚动到文本末尾。语言间链接放置在文章的最底部,位于所有文章文本之下。
链接采用以下形式:[[语言代码:母语文章名称]]。例如,如果您正在处理英语文章Cat,并且想要链接到法语文章Chat,您将在英语文章末尾添加链接 [[fr:chat]]。保存页面后,左侧边栏中会显示一个带有文本 Français 的链接;如果单击它,您将被带到http://fr.wikipedia.org/wiki/Chat的法语文章。同样,要链接到德语文章,您将输入 [[de:Hauskatze]],这将在边栏的 Deutsch 下为您提供到http://de.wikipedia.org/wiki/Hauskatze的链接。
按照惯例,语言间链接放置在页面上的类别标签下方,每个链接独占一行。页面上排序语言间链接最常用的方法是按代码字母顺序排序。
- 损坏的语言间链接
链接时请确保您选择了正确的文章。特别是对于具有多种含义的概念,找到完全等价的词有时很困难——注意不要链接到错误的概念。还要注意不要链接到消歧义页面,这些页面可能存在于一个维基百科中,而不存在于另一个维基百科中。显然,并非所有文章都存在于所有语言中;由于英语维基百科是最大的,它通常包含其他语言没有的文章,但您可能会对较小维基百科的覆盖范围感到惊讶。如果您创建了一个似乎无处可达的语言间链接,请检查您是否输入了错误的标题。
为了完整起见,您还应该转到其他语言中的文章,以添加一个返回第一篇文章的语言间链接(例如,页面Hauskatze也应该链接到英语Cat)。创建语言间链接时,在编辑摘要中添加一个简单的 +en: 或 interwiki。您可能还会发现更多要添加到您正在处理的原始文章中的该文章的语言间链接。如今,机器人自动执行了大部分此类缺少的语言间链接。
要链接到另一个语言页面而不将其显示为语言间链接,请使用相同的语法,但在语言前缀前面放置一个冒号,就像您链接到类别名称一样。在英语维基百科页面上键入fr:chat 将显示为一个与您键入的相同的浅蓝色链接,该链接指向http://fr.wikipedia.org/wiki/Chat,但该链接不会出现在左侧边栏中。一些重要的通用原则仍然适用:优先使用内部链接意味着不要使用指向另一种语言维基百科的链接来替换指向英语文章的红色链接,寻求外部参考意味着您不应该依赖另一个维基百科来作为文章中重要事实的来源。翻译本身不足以验证,并且其他维基百科页面——无论使用何种语言——都不能作为来源。
- 进一步阅读
- http://en.wikipedia.org/wiki/Wikipedia:Multilingual_coordination 多语种协调,多语种项目的简介
- http://meta.wikimedia.org/wiki/List_of_Wikipedias 所有维基百科的列表,包括语言代码(在 Wiki 列中)。语言代码在您链接到的项目(维基百科、维基词典等)中都是相同的。
- http://en.wikipedia.org/wiki/Wikipedia:Interlanguage_links 语言间链接的帮助
英语维基百科拥有一个全球性的编辑社区,作为一名编辑,您将定期与来自许多时区的人员合作。英语维基百科的典型贡献者很可能是在英语国家(美国、加拿大、英国、澳大利亚等)的母语人士,但许多编辑既不是母语人士,也不在这些地方。了解来自世界各地的人是参与维基百科的好处之一。由于编辑相对匿名,您通常不知道您的维基朋友来自哪里,甚至不知道他们的国籍。为了克服文化差异,请记住关于在网上与他人礼貌互动的指南,不要过分依赖区域俚语或网络术语,因为并非每个人都能理解。
贡献者的多样性也反映在维基百科主题的全球广度上。显著性不具有文化或语言特异性;地理特征、重要人物和其他值得注意的区域主题应该明确地包含在维基百科中,无论它们位于世界何处或与世界何处相关。
- 简易英语维基百科
- 简易英语维基百科是一个独立于英语维基百科的项目。该维基百科旨在提供用简化英语编写的文章,专为学习英语的人和儿童设计。整个界面都已重写为使用更简单的语言,例如,随机页面链接是显示任意页面链接。大多数文章都从英语维基百科版本“翻译”成更短、更简单的文章。反过来,这些文章可以成为其他语言工作者的一种资源。简易英语是那些有兴趣教授或学习英语作为第二语言的人的理想项目。简易英语位于http://simple.wikipedia.org/,截至 2008 年年中,大约有 33,000 篇文章。
一些维基项目也侧重于世界特定地区。例如,维基项目印度专注于撰写有关印度的文章、审查有关印度的现有文章以及支持一个面向对印度相关主题感兴趣的编辑的社区门户。可以在Wikipedia:WikiProject Council/Directory/Geographical找到处理地理主题的维基项目的列表。
其他维基项目专注于将其他维基百科中有用或有趣的文章翻译成英语(其他语言的维基百科有类似的项目,专注于将文章翻译成他们的本地语言)。协调英语翻译的地方是w:Wikipedia:Translation。翻译带来了双重挑战:编写既是优秀的英语又是优秀的维基百科内容的文章。
非英语母语人士用英语撰写文章时,通常会出现风格问题。对这些文章进行清理工作有助于使有价值的材料可用。当根据第 4 章“理解和评估文章”中提出的标准或在删除讨论中评估文章时,请考虑到文章可能是由一位在该主题方面有专业知识的非母语人士撰写的。
在用英语撰写有关非英语国家/地区主题的文章时,来源可能存在问题。例如,查找英语来源材料可能要困难得多。检查语言间链接以查找其他语言维基百科上的相关文章,这对于查找来源和更多信息很有帮助。
尽管引用非英语来源并非理想之选,但您可以这样做。您可以使用特殊的模板来识别其他语言的来源;例如,在指向意大利语网站的链接之前放置可选模板Template:It icon 会提醒读者该来源是意大利语的(语言代码与前面提到的相同标准 ISO 代码相同)。引用非维基百科母语的来源总比不引用来源好。也请尝试查找英语来源,以便读者可以更轻松地核实您的事实。(如果不同语言的来源存在分歧,这可能是值得注意和包含的有用信息。)
- 进一步阅读
- http://en.wikipedia.org/wiki/Wikipedia:WikiProject_Council/Directory/Geographical 有关地理区域和地点的维基项目
- http://en.wikipedia.org/wiki/Wikipedia:Translation 请求和协调将外语维基百科翻译成英语的地方