人工语言/中级/书写

← 中级/历史词源学	中级书写	中级不规则性 →
	人工语言

(这里提到的所有音素和语音转录都是用 X-SAMPA)

文字，或书写系统，是许多人在接触另一种语言时首先注意到的东西之一。许多人在人生的某个阶段，都尝试过创造某种“代码”，用他们自己的符号与母语的字母建立一对一的对应关系。继续阅读，了解如何为一种语言创建现实的文字。

文字类型

主要有五种文字类型。本页按从最进化到最不进化的顺序排列。所有这些系统都有不同的优点和缺点，例如，表意文字系统在语言有很多方言的情况下很有用，但如果想提高人工语言的使用者识字率，字母表会很有用。

字母表是你可能比较熟悉的一种类型。它由一系列符号组成，通常在 10 到 45 个之间，每个符号代表语言中的一个辅音或元音。有些可能有一些重复的字母（例如，英语 C、K 和 Q），但这些通常具有某些历史意义，将在后面讨论。其他字母表将包含用于辅音连缀的符号，例如希腊语“Ξ”/ks/，西里尔字母“Ц”/ts/，甚至英语“X”/ks, gz/。
辅音字母，也称为辅音字母表，标记辅音，但不标记元音。阿拉伯语和希伯来语就是例子。虽然这些语言确实有显示元音的方法，通过变音符号，但通常不显示，除非是儿童读物、外国人读物或宗教文本。有些辅音字母，比如腓尼基语，根本没有标记元音的系统！它们通常包含 15 到 35 个符号。
音节文字包含与元音配对的辅音，可以用变音符号进行更改。印地语和其他许多南亚语言就是例子。每个符号都有一个“固有元音”，通常是/a/，所以你每个单独的符号都代表/pa/、/ba/、/ta/、/da/等。元音可以用变音符号进行更改或静音。它们通常包含 30 到 60 个符号，不包括变音符号。
音节文字包含语言中每个音节的不同符号，例如阿姆哈拉语、彝语或切罗基语。换句话说，每个元音和辅音都有一个单独的音节，比如/ka/、/ke/、/ki/、/ko/等。代表相同辅音的符号可能相关（比如在 Ojibwe 语中，符号是旋转的），或者可能与其他符号没有相似之处，比如在彝语或切罗基语中。音节文字的大小通常在 40 个符号到 400 个符号之间，彝语是最大的标准化音节文字，超过 800 个符号。
表意文字系统包含代表单个语素的符号，或者语言中最小的有意义单位。（例如，英语中的“手”、“-er”、“un-”）。许多语言包含一些表意文字符号，例如“1”、“@”和“&”，但有一些语言，例如汉语、日语、古埃及语和玛雅语，使用表意文字来代表他们整个语言的很大一部分或全部。

表意系统使用一个符号来代表一个思想或概念。由于语言不是直接由思想和概念构成的，书写系统代表的是语言，因此真正的表意系统并不存在。它们将在“外星”语言中进行讨论，尽管如此。汉语经常被描述为“表意”——这要么是将“表意”一词宽泛地用于指代“表意文字”，要么就是误解——汉字不是直接代表概念。日语汉字更接近于“表意”的理想，一个符号代表一个上下文中几个同义词中的任何一个。

字母表

字母表是欧洲以及欧洲曾经殖民地区的地区使用的主要书写系统。基本上，它们代表每个声音一个符号，包括元音。

然而，字母表，尤其是拉丁字母表，往往更加复杂。每个符号通常代表不止一个声音，有时在语言中有所区分，有时没有。例如，英语<c>代表/k/和/s/，<x> /ks/和/gz/（如 exist），或者<a> /a/、/A/、/{/、/O/或/@/。造成这种情况的主要原因是拉丁字母是为拉丁语而创造的，只是为了后来的语言而被调整。英语本身最初使用的是卢恩文字，北欧语言也是如此。用拉丁字母书写的拉丁语完全是语音的。

许多字母表还包含代表完全不同声音的字母组合。这些被称为二合字母。在英语中，主要的辅音二合字母是<sh> /S/，<ch> /tS/，<ng> /N/，以及许多其他二合字母。双元音，或元音组合，也经常出现。英语<i>代表/aj/以及/i/或/I/。一些语言使用二合字母表示双元音，比如<ei>代表/ej/。

请注意，上述情况经常发生。随着语言的改变，它们的正字法（书写系统）可能随之改变，但并不总是发展到与之相匹配的地步。几乎没有一种语言的字母只代表一个声音，而不是其他声音。一个现实的人工文字不应该与英语之间有直接的对应关系。

变音符号是字母表可能使用的另一种方法。创造新的符号可能很困难，也很难记忆，因此许多语言创造了“变音符号”，即在字母上添加的小笔画，用于标记新的声音。拉丁字母语言中使用的主要变音符号有锐音：'（á，é，等等，通常用于标记重音），重音（à，è，等等），尖音符（â，ê），分音符（ä，ë），波浪号（ã，ñ，通常在元音上标记鼻音化），小尾巴（ç），以及许多其他变音符号。“连字”，或者字母组合，也可能被引入，例如“æ”。符号“&”实际上是<E>和<T>的严重修改后的连字，构成“et”，拉丁语中的“and”。

然而，有些语言确实创造了新的字母，这些字母通常基于以前的系统。例如“þ”（thorn，/T/），它源自卢恩文字（ᚦ）和“ð”（eth，/D/），是在中世纪发展起来的，这些字母在冰岛语、古英语和几种相关语言中使用。

有些字母本身不发音，但会影响其他字母。例如，西里尔字母<Ь>（软符号）将它之前的辅音腭化。有些字母可以同时执行一个功能和一个声音，例如俄语<Я>（“ya”），它既腭化了前面的辅音，又发音为/a/。

有一些文字被称为特征文字，它们类似于字母表，但显示的是音素特征，而不是音素本身。最好的例子无疑是韩语谚文，尽管特征文字元素也出现在其他一些文字中，例如日语平假名和片假名，它们主要为音节文字，但会使用变音符号来表示有声。

自然语言字母表的例子

拉丁字母（包括英语、德语、法语、西班牙语、罗马尼亚语、波兰语、捷克语、斯瓦希里语、芬兰语、越南语、纳瓦特尔语等等）
西里尔字母（包括俄语、乌克兰语、保加利亚语、马其顿语、哈萨克语等等）
希腊语
格鲁吉亚语
亚美尼亚语
蒙古语

辅音字母

辅音字母是中东地区的主要书写系统。基本上，它们以字母的方式标记辅音，但元音通常不标记。

阿拉伯语和希伯来语辅音字母完全由辅音组成。元音可以标记，但通常不标记。阿拉伯语有六个元音标记。其中三个是“短元音”，只用变音符号标记。另外三个是“长元音”，它们与一些辅音共享符号。/a/ 与'alif /? /共享，/i/ 与yaa /j/ 共享，/u/ 与waaw /w/ 共享。当它们被视为辅音或元音时，可以更清楚地看到元音的显示方式。

阿拉伯语还有一个变音符号叫做“sukuun”，意思是它所在的字母上面没有元音。如果 sukuun 在'alif、yaa 或 waaw 上面，它们就起辅音的作用。如果没有 sukuun，而是元音标记，它们就变成了长元音。如果 sukuun 在上面，但前面的辅音有元音，它们也可以成为双元音。因此，以下形式发音为 /kaj/。

Ø a

Y K

（其中 Ø 是 sukuun，请记住阿拉伯语是从右到左阅读）。

由于元音通常不标记，因此发音必须通过语境推断。序列“KY”（使用英语顺序）可以发音为

/ kaja kajI kajV kIja kIjI kIjV kVja kVjI kVjV kaj /

自然语言辅音字母的例子

阿拉伯语（包括阿拉伯语、伊朗语和普什图语）
乌尔都语
希伯来语（包括希伯来语和意第绪语）
叙利亚语（现代叙利亚语/亚拉姆语使用）
腓尼基语和草书，均已灭绝。

音节文字

辅音字母表是印度、其他南亚国家和东南亚的主要书写系统。它们基本上是一组具有共同固有元音的音节，必须用变音符号改变。

所有音节都以一个固有元音开始，通常是 /a/，以及一个不同的辅音：ka、ca、ta、ta、pa 等。这些都有它们自己的符号。例如，你想写音节 <ki>。然后，将 <i> 变音符号添加到 <ka> 符号上，并否定 /a/。请注意，在印度和东南亚语言中，变音符号可以出现在字母的前后，而不仅仅是上面或下面。

印地语对所有元音和双元音都有变音符号——a、e、i、o、u、r、ai 和 au。但如果一个词或音节以元音开头呢？可能有两种方法可以处理这种情况。在大多数亚洲辅音字母表中，有一组“独立元音”，它们是完整的字母，就像其他任何辅音一样，它们的作用只是用于音节开头的元音。

另一种方法在任何南亚辅音字母表中都没有使用，但仍然可行。只需创建一个“元音载体”，一个不发音的字母，但可以承载元音变音符号，就像希伯来语的 aleph 一样。

许多这些辅音字母表还包含“连音辅音”，你不需要做太多。这些基本上是连字，两个字母的形式组合成一个“空间”，它们可以一起带元音。例如，当“ta”和“ka”组合在一起时，它们就变成了“tka”，可以像其他任何辅音一样带变音符号。

Natlang 辅音字母表示例

天城体，用于印地语、马拉地语、尼泊尔语和其他许多语言
马拉雅拉姆语，用于马拉雅拉姆语、孔卡尼语，有时也用于科达古语。
孟加拉语，用于孟加拉语和阿萨姆语。
古木基文，用于旁遮普语。
古吉拉特语，用于古吉拉特语和卡奇语。
奥里雅语，用于奥里雅语和其他几种语言。
泰米尔语，用于泰米尔语，有时也用于礼仪梵语。
僧伽罗语，用于僧伽罗语。
卡纳达语，用于卡纳达语和图卢语。
泰卢固语，用于泰卢固语。
藏语，用于藏语和宗喀语
泰语，用于泰语、南泰语和其他几种语言。
高棉语，用于高棉语，有时也用于巴利语。
老挝语，用于老挝语和老挝的其他一些语言。
缅甸语，用于缅甸语、孟语和克伦语。

音节文字

音节文字在世界各地广泛使用。它们包含语言中每个 CV（辅音 + 元音）组合的单独符号，尽管最后的辅音有许多表达方式。

以下是一个典型音节文字的例子，使用罗马字母拼写。这是克里语系统

ê pê tê kê cê mê nê sê šê yê wê rê lê
i pi ti ki ci mi ni si ši yi wi ri li
î pî tî kî cî mî nî sî šî yî wî rî lî
o po to ko co mo no so šo yo wo ro lo
ô pô tô kô cô mô nô sô šô yô wô rô lô
a pa ta ka ca ma na sa ša ya wa ra la
â pâ tâ kâ câ mâ nâ sâ šâ yâ wâ râ lâ

-h -p -t -k -c -m -n -s -š -y -w -r -l

请注意，还有单独的元音符号。为了写最后的辅音（CVC 形式），添加最后一行符号，称为“尾音”。所以，“tak”将用两个符号来写：<ta> 和 <-k>。许多音节文字使用这种方法，它基本上局限于只有少量合法尾音的语言。

玛雅音节文字系统使用的另一种尾音系统是“音调和谐原则”。它指出，最后的元音是用重复前一个元音来标记的。例如，一个像“kalo”这样的词，通常用两个符号来写：ka-lo。但是，如果你想写“kal”这个音节，就需要重复前一个元音：ka-la。由于元音被重复，因此在第二个音节中被忽略。这适用于任何元音。但是，如果你想写“kala”这个音节呢？这需要三个音节，再加上一个简单的元音：ka-la-a。第二个“a”被否定，但由下一个音节返回。

第三种系统，由赫梯语使用，包含两组音节，一组为 CV 形式，另一组为 VC 形式。这样，当需要 C₁VC₂ 形式的音节时，就可以写 C₁V-VC₂，例如，<ka><al> 表示“kal”。此外，当需要将元音变长时，例如“kāl”，模式就变成了 C₁V-V-VC₂：<ka><a><al>。对于“kala”，只需写 <ka><la>，因为 /l/ 将移到下一个音节。

有时，但并非总是如此，具有相关性的音节，例如具有相同辅音的音节，看起来很相似。例如，音节“ka”、“ke”、“ki”等可能看起来很相似。在像奥吉布韦语这样的系统中，元音符号通过简单地将符号旋转来改变。

Natlang 音节文字示例

克里语（旋转），用于奥吉布韦语、克里语、因纽特语和许多其他北美土著语言；统称为“土著音节文字”。
切罗基语
埃塞俄比亚语，用于阿姆哈拉语、吉兹语、提格雷语和其他几种语言
片假名和平假名，用于日语
彝语
塞浦路斯语、线性 B 和凯尔特伊比利亚语，均已灭绝

还有许多其他系统。

半音节文字

有一组来自罗马化西班牙之前的文字，处于真正的字母表和音节文字之间的中间类别。在这些文字中，爆破音与后面的元音结合成一个音节符号——例如，有一个 PA 的符号，另一个是 PI 的符号，另一个是 PE 的符号，等等——但所有其他辅音和元音也有单独的符号。在这种系统中，例如，短语“barenarkenti”将用九个符号 <ba> <r> <e> <n> <a> <r> <ke> <n> <ti> 来拼写。事实上，这些系统很可能演变自所谓的冗余字母表，其中爆破音根据后面的元音而有不同的符号，就像古代伊特鲁里亚字母表一样，其中 /k/ 音在 <A> 前写为 <K>，在 <E> 或 <I> 前写为 <C>，在 <U> 前写为 <Q>（伊特鲁里亚语没有 /o/ 音）。

表意文字系统

表意文字系统被用于书写汉语、日语、古埃及语、玛雅语、苏美尔语和许多其他语言。古代文明首先创造了表意文字，然后将其发展成其他系统。

在纯粹的表意文字系统（如果自然界中存在这样的系统的话）中，每个符号代表一个语素，即语言中最小的有意义的部分。例如，“手”、“红”、“地方”、“-er”、“-ist”、“un-”和“anti-”都是语素。在表意文字系统中，这些都将有自己的符号。正如你可能想象的那样，大多数语言中都有数千个语素，因此任何表意文字系统中都存在数千个符号。

这些符号并不都是随机的。一般来说，代表可见的想法或事物的词的符号通常是小图画。（请记住，书写一直在发展，因此几千年后，不会留下太多的相似之处！）例如，“太阳”、“月亮”、“人”、“孩子”、“水”、“火”、“左”、“右”、“狗”、“马”、“树”、“花”等词可能被画成图片。

并非所有词都可以这样画。你怎么画“爱”或“-er”或“anti-”呢？不同的语言有不同的方法。在某些情况下，用发音相似的词来代替，例如，用“ant”来表示“anti-”。如果你经常这样做，你就在走向音节文字、辅音字母表或字母表。然而，在某些情况下，会画另一张图片来“解释”新词：例如，你可能会在“ant”旁边画一把长矛来表示“anti-”——长矛意味着你反对，对吧？在古埃及语中，长矛会被作为一个单独的符号放在一边，而在汉语中，长矛会被融入到“ant”符号中，形成一个表示“anti-”的新符号。（这就是为什么埃及语这样的文字有时被称为音义文字，这也是用于混合使用表意文字和其他系统的语言的名称。）这完全取决于你。

事实上，据估计，90% 以上的汉字都是用上述方法形成的：取一个发音相似的现有符号，并融入另一个符号来解释其含义。然而，随着时间的推移，这些字的形状已经固定下来，而且声音和意义发生了很多变化，因此一些字由实际上不再很好地代表其意义或声音的符号组成。

如此庞大的系统注定不会是纯粹的；它的一部分或整个部分可能正在向其他类型的系统转变，而它的不同部分可能正在向不同的方向转变。会有语素由多个没有独立含义的符号来表示，还会有符号代表多个词。

使用表意文字系统的语言

汉语
日语汉字、韩语汉字和越南 chữ Nôm，所有都是汉字表意文字的借用
契丹语，古代东北亚的一种已灭绝的阿尔泰语系语言
女真语，满语的前身
西夏语，中国西北部的一种古代语言
纳西语，云南省的一种缅甸- लो लो语

使用音义文字系统的语言

日语
朝鲜语（混合使用谚文和汉字的形式）
古埃及语
卢维语（在古代小亚细亚）
苏美尔语
阿卡德语
玛雅语
萨波特克语
米斯特克语
阿兹特克语

现在，如果你已经决定了想要哪种书写系统，还需要完成三个步骤：书写方向、文字历史和书写媒介。然后，你就可以开始真正的文字创作了。

书写方向

所有文字都有特定的书写方向。拉丁语从左到右书写。希伯来语和阿拉伯语从右到左书写。蒙古语从上到下书写。这些是地球上真实文字中主要的方向类型。

从左到右：英语、西里尔字母、希腊语和许多其他系统。
从右到左：希伯来语、阿拉伯语、乌尔都语、亚述语和其他几个系统。
从上到下：蒙古语，有时也用于汉语
牛耕式：古希腊语

“牛耕式书写”（Boustrophedon）指的是一种书写方式，其中一行文字从左到右阅读，下一行从右到左阅读，再下一行又从左到右阅读，以此类推。

THIS IS AN EXAMPLE
ИI HƧI˩GИƎ FO
BOUSTROPHEDON
.Ǝ˩YTƧ

需要注意的是，在古希腊语中，一种牛耕式语言，有时字母在反方向阅读时会实际翻转过来。例如，希腊字母（“digamma”）从左到右读时是，但从右到左读时，两端会朝左。

如果你想坚持使用上述方法之一，可以继续。大多数文字都使用它们。下面描述了几个更复杂的系统。

一些文字可以向多个方向书写，即从左到右、从右到左和从上到下都是可以接受的。汉语和古埃及语就是这样的。在古埃及语中，所有带有面部特征的象形文字都朝向开始阅读的方向。所以，如果你从右到左阅读，所有带有面部特征（或可辨认的正面）的象形文字都会“面向”右侧。在汉语中，必须通过上下文来确定方向。

另一个系统是“旋转式”系统，这是一个非常罕见的系统。据我们所知，只有这一个文字系统使用过它，rongorongo（复活节岛文字）。它类似于牛耕式书写，但字母在每行之后还会旋转 180 度！如果你在每行之后将阅读板旋转一下，它们看起来就会正常。以下是用英文字母的示例：

一些其他的想法，据我们所知，还没有被使用。

螺旋式，向内或向外。
以顺时针或逆时针方向写圆圈，在写每个字时旋转它；本质上是从左到右或从右到左，但每一句话都在最后一个环的外面。
顶点式；句子的每个部分都在它自己的行上，指向一个所有句子都汇聚的顶点。

文字史

文字不是一成不变的。它们不断变化，就像语言一样。比较一下古埃及象形文字和现代拉丁文字。信不信由你，现代拉丁文字最终源于 *原西奈文字*，这是一组小型的埃及象形文字。这些象形文字后来被腓尼基人采用，并被大大简化，每个象形文字都分配了一个单一的音节。由于与腓尼基人有着密切的接触，希腊人很快也采用了他们的字母，但改变了他们的一些辅音字母，将代表希腊语中不存在的音节的辅音字母变成了希腊语的元音符号。在某个时间，尽管我们不完全清楚原因，希腊语开始使用牛耕式书写而不是从右到左书写，最终坚持使用从左到右书写。当这种转变发生时，所有字母都水平翻转过来，形成了现在的希腊字母。然后，伊特鲁里亚人和意大利半岛上的拉丁人采用了希腊字母，并进行了微小的修改，拉丁字母最终成为现在欧洲大部分地区使用的文字。斯拉夫字母也源于希腊字母，这是因为俄国人皈依了东正教，在经过大约 1000 年的变革后，现代斯拉夫字母出现了。

字母“A”的简史
埃及象形文字牛头	原闪族文字牛头	腓尼基语 aleph	希腊语 Alpha	伊特鲁里亚语 A	罗马语 A

在原西奈文字和腓尼基语中，这个字母代表喉塞音 /?/, 但希腊语中没有这个音节，所以它变成了 /a/。

“A”最初是 “aleph”，即牛。后来身体消失了，只剩下头部。然后头部被简化为一条简单的线，保留了最具识别度的部分（角）。最终，角穿透了这条线，字母在腓尼基语中翻转到了侧面。在希腊语中，它再次翻转，在几条线被修剪后，它变成了现代拉丁语/希腊语/斯拉夫语的“A”。

注意复杂性的变化。早期的文字几乎可以肯定是一种象形文字，每个符号代表的正是它看起来的样子。但是，随着时间的推移，文字传播开来，对许多人来说，这仅仅成了毫无意义的复杂性。符号开始简化，有时变成了字母。当一个识字的人开始与一个不识字的人进行贸易时，他们的书写系统就有一个很好的机会传播开来。有时，一种文字会胜过另一种文字。例如，在古代印度，主要使用两种文字：婆罗米文和佉卢文，但佉卢文已经不再使用，现在印度和东南亚部分地区的主要文字都是婆罗米文的演变而来。

有时，早期的象形文字系统并没有简化多少。在古代汉语文字中，汉字发生了变化，但许多汉字并没有像原西奈文字那样显著地简化。现代汉语的表意文字系统仍然非常复杂。1949 年的主要改革是由中国政府推行的。

需要注意的是，欧洲的文字种类繁多，而东南亚的文字种类却相对较少。几乎整个欧洲都使用拉丁字母或斯拉夫字母，但在东南亚，每个国家都至少有一种自己的文字。这可能是因为罗马帝国的存在。罗马人统一了大部分欧洲，并在他们衰落之前建立了自己的文字系统，他们的文字一直保留下来。东南亚不存在这样的帝国，因此出现了种类繁多的文字。

所以，基本上，当古代象形文字系统不再只是供祭司使用时，它们就会简化，因此可以简写。对于普通人来说，仔细地细化每个符号只是一项浪费时间的事情。这在今天仍然适用，只是程度较轻，但这正是草书的来源。甚至古埃及象形文字也有高度简化的形式，被称为“草书”，这种文字被普通人使用。你可以在罗塞塔石碑（右图）的中间部分看到草书（图片在右侧）。

这是一个链接，指向一个好的图表（在维基媒体之外），展示了一个单一符号在东南亚语言中的演变过程：[1]

书写媒介

书写文字的表面实际上对文字的影响很大。当刻在石头上时，比如在富萨克文字或其他符文文字中，字母往往非常棱角分明，由直线组成。在石头上刻曲线比在纸上更难。另外，尽管罗塞塔石碑是刻在石头上的，但埃及草书比象形文字要“流畅”得多，而且通常是用纸莎草纸写成的。

古代苏美尔人用泥土写字，用芦苇笔在泥土上刻下符号。这使它具有非常独特的风格。这种类型的书写被称为“楔形文字”。

一些现代语言，如缅甸语，保留了他们过去独特的文字。缅甸语的圆形外形源于它最初是用棕榈叶写成的，如果直线过多，棕榈叶就会撕裂。

在拉丁语、希腊语和斯拉夫语的混合大小写系统（即既有“大写”（大写字母）又有“小写”（小写字母））中，小写字母来自大写字母的草书形式。

现在，如果你已经考虑过你的文字，并选择了一种文字类型、书写方向和书写媒介，那么你现在就可以创建你自己的文字了。

下一节：不规则性