人工语言/中级/书写
此模块的文本目前不完整。 |
(这里提到的所有音素和语音转录都是用 X-SAMPA)
文字,或书写系统,是许多人在接触另一种语言时首先注意到的东西之一。许多人在人生的某个阶段,都尝试过创造某种“代码”,用他们自己的符号与母语的字母建立一对一的对应关系。继续阅读,了解如何为一种语言创建现实的文字。
主要有五种文字类型。本页按从最进化到最不进化的顺序排列。所有这些系统都有不同的优点和缺点,例如,表意文字系统在语言有很多方言的情况下很有用,但如果想提高人工语言的使用者识字率,字母表会很有用。
- 字母表是你可能比较熟悉的一种类型。它由一系列符号组成,通常在 10 到 45 个之间,每个符号代表语言中的一个辅音或元音。有些可能有一些重复的字母(例如,英语 C、K 和 Q),但这些通常具有某些历史意义,将在后面讨论。其他字母表将包含用于辅音连缀的符号,例如希腊语“Ξ”/ks/,西里尔字母“Ц”/ts/,甚至英语“X”/ks, gz/。
- 辅音字母,也称为辅音字母表,标记辅音,但不标记元音。阿拉伯语和希伯来语就是例子。虽然这些语言确实有显示元音的方法,通过变音符号,但通常不显示,除非是儿童读物、外国人读物或宗教文本。有些辅音字母,比如腓尼基语,根本没有标记元音的系统!它们通常包含 15 到 35 个符号。
- 音节文字包含与元音配对的辅音,可以用变音符号进行更改。印地语和其他许多南亚语言就是例子。每个符号都有一个“固有元音”,通常是/a/,所以你每个单独的符号都代表/pa/、/ba/、/ta/、/da/等。元音可以用变音符号进行更改或静音。它们通常包含 30 到 60 个符号,不包括变音符号。
- 音节文字包含语言中每个音节的不同符号,例如阿姆哈拉语、彝语或切罗基语。换句话说,每个元音和辅音都有一个单独的音节,比如/ka/、/ke/、/ki/、/ko/等。代表相同辅音的符号可能相关(比如在 Ojibwe 语中,符号是旋转的),或者可能与其他符号没有相似之处,比如在彝语或切罗基语中。音节文字的大小通常在 40 个符号到 400 个符号之间,彝语是最大的标准化音节文字,超过 800 个符号。
- 表意文字系统包含代表单个语素的符号,或者语言中最小的有意义单位。(例如,英语中的“手”、“-er”、“un-”)。许多语言包含一些表意文字符号,例如“1”、“@”和“&”,但有一些语言,例如汉语、日语、古埃及语和玛雅语,使用表意文字来代表他们整个语言的很大一部分或全部。
表意系统使用一个符号来代表一个思想或概念。由于语言不是直接由思想和概念构成的,书写系统代表的是语言,因此真正的表意系统并不存在。它们将在“外星”语言中进行讨论,尽管如此。汉语经常被描述为“表意”——这要么是将“表意”一词宽泛地用于指代“表意文字”,要么就是误解——汉字不是直接代表概念。日语汉字更接近于“表意”的理想,一个符号代表一个上下文中几个同义词中的任何一个。
字母表是欧洲以及欧洲曾经殖民地区的地区使用的主要书写系统。基本上,它们代表每个声音一个符号,包括元音。
然而,字母表,尤其是拉丁字母表,往往更加复杂。每个符号通常代表不止一个声音,有时在语言中有所区分,有时没有。例如,英语<c>代表/k/和/s/,<x> /ks/和/gz/(如 exist),或者<a> /a/、/A/、/{/、/O/或/@/。造成这种情况的主要原因是拉丁字母是为拉丁语而创造的,只是为了后来的语言而被调整。英语本身最初使用的是卢恩文字,北欧语言也是如此。用拉丁字母书写的拉丁语完全是语音的。
许多字母表还包含代表完全不同声音的字母组合。这些被称为二合字母。在英语中,主要的辅音二合字母是<sh> /S/,<ch> /tS/,<ng> /N/,以及许多其他二合字母。双元音,或元音组合,也经常出现。英语<i>代表/aj/以及/i/或/I/。一些语言使用二合字母表示双元音,比如<ei>代表/ej/。
请注意,上述情况经常发生。随着语言的改变,它们的正字法(书写系统)可能随之改变,但并不总是发展到与之相匹配的地步。几乎没有一种语言的字母只代表一个声音,而不是其他声音。一个现实的人工文字不应该与英语之间有直接的对应关系。
变音符号是字母表可能使用的另一种方法。创造新的符号可能很困难,也很难记忆,因此许多语言创造了“变音符号”,即在字母上添加的小笔画,用于标记新的声音。拉丁字母语言中使用的主要变音符号有锐音:'(á,é,等等,通常用于标记重音),重音(à,è,等等),尖音符(â,ê),分音符(ä,ë),波浪号(ã,ñ,通常在元音上标记鼻音化),小尾巴(ç),以及许多其他变音符号。“连字”,或者字母组合,也可能被引入,例如“æ”。符号“&”实际上是<E>和<T>的严重修改后的连字,构成“et”,拉丁语中的“and”。
然而,有些语言确实创造了新的字母,这些字母通常基于以前的系统。例如“þ”(thorn,/T/),它源自卢恩文字(ᚦ)和“ð”(eth,/D/),是在中世纪发展起来的,这些字母在冰岛语、古英语和几种相关语言中使用。
有些字母本身不发音,但会影响其他字母。例如,西里尔字母<Ь>(软符号)将它之前的辅音腭化。有些字母可以同时执行一个功能和一个声音,例如俄语<Я>(“ya”),它既腭化了前面的辅音,又发音为/a/。
有一些文字被称为特征文字,它们类似于字母表,但显示的是音素特征,而不是音素本身。最好的例子无疑是韩语谚文,尽管特征文字元素也出现在其他一些文字中,例如日语平假名和片假名,它们主要为音节文字,但会使用变音符号来表示有声。
- 拉丁字母(包括英语、德语、法语、西班牙语、罗马尼亚语、波兰语、捷克语、斯瓦希里语、芬兰语、越南语、纳瓦特尔语等等)
- 西里尔字母(包括俄语、乌克兰语、保加利亚语、马其顿语、哈萨克语等等)
- 希腊语
- 格鲁吉亚语
- 亚美尼亚语
- 蒙古语
辅音字母是中东地区的主要书写系统。基本上,它们以字母的方式标记辅音,但元音通常不标记。
阿拉伯语和希伯来语辅音字母完全由辅音组成。元音可以标记,但通常不标记。阿拉伯语有六个元音标记。其中三个是“短元音”,只用变音符号标记。另外三个是“长元音”,它们与一些辅音共享符号。/a/ 与'alif /? /共享,/i/ 与yaa /j/ 共享,/u/ 与waaw /w/ 共享。当它们被视为辅音或元音时,可以更清楚地看到元音的显示方式。
阿拉伯语还有一个变音符号叫做“sukuun”,意思是它所在的字母上面没有元音。如果 sukuun 在'alif、yaa 或 waaw 上面,它们就起辅音的作用。如果没有 sukuun,而是元音标记,它们就变成了长元音。如果 sukuun 在上面,但前面的辅音有元音,它们也可以成为双元音。因此,以下形式发音为 /kaj/。
Ø a
Y K
(其中 Ø 是 sukuun,请记住阿拉伯语是从右到左阅读)。
由于元音通常不标记,因此发音必须通过语境推断。序列“KY”(使用英语顺序)可以发音为
/ kaja kajI kajV kIja kIjI kIjV kVja kVjI kVjV kaj /
- 阿拉伯语(包括阿拉伯语、伊朗语和普什图语)
- 乌尔都语
- 希伯来语(包括希伯来语和意第绪语)
- 叙利亚语(现代叙利亚语/亚拉姆语使用)
- 腓尼基语和草书,均已灭绝。
辅音字母表是印度、其他南亚国家和东南亚的主要书写系统。它们基本上是一组具有共同固有元音的音节,必须用变音符号改变。
所有音节都以一个固有元音开始,通常是 /a/,以及一个不同的辅音:ka、ca、ta、ta、pa 等。这些都有它们自己的符号。例如,你想写音节 <ki>。然后,将 <i> 变音符号添加到 <ka> 符号上,并否定 /a/。请注意,在印度和东南亚语言中,变音符号可以出现在字母的前后,而不仅仅是上面或下面。
印地语对所有元音和双元音都有变音符号——a、e、i、o、u、r、ai 和 au。但如果一个词或音节以元音开头呢?可能有两种方法可以处理这种情况。在大多数亚洲辅音字母表中,有一组“独立元音”,它们是完整的字母,就像其他任何辅音一样,它们的作用只是用于音节开头的元音。
另一种方法在任何南亚辅音字母表中都没有使用,但仍然可行。只需创建一个“元音载体”,一个不发音的字母,但可以承载元音变音符号,就像希伯来语的 aleph 一样。
许多这些辅音字母表还包含“连音辅音”,你不需要做太多。这些基本上是连字,两个字母的形式组合成一个“空间”,它们可以一起带元音。例如,当“ta”和“ka”组合在一起时,它们就变成了“tka”,可以像其他任何辅音一样带变音符号。
- 天城体,用于印地语、马拉地语、尼泊尔语和其他许多语言
- 马拉雅拉姆语,用于马拉雅拉姆语、孔卡尼语,有时也用于科达古语。
- 孟加拉语,用于孟加拉语和阿萨姆语。
- 古木基文,用于旁遮普语。
- 古吉拉特语,用于古吉拉特语和卡奇语。
- 奥里雅语,用于奥里雅语和其他几种语言。
- 泰米尔语,用于泰米尔语,有时也用于礼仪梵语。
- 僧伽罗语,用于僧伽罗语。
- 卡纳达语,用于卡纳达语和图卢语。
- 泰卢固语,用于泰卢固语。
- 藏语,用于藏语和宗喀语
- 泰语,用于泰语、南泰语和其他几种语言。
- 高棉语,用于高棉语,有时也用于巴利语。
- 老挝语,用于老挝语和老挝的其他一些语言。
- 缅甸语,用于缅甸语、孟语和克伦语。
音节文字在世界各地广泛使用。它们包含语言中每个 CV(辅音 + 元音)组合的单独符号,尽管最后的辅音有许多表达方式。
以下是一个典型音节文字的例子,使用罗马字母拼写。这是克里语系统
ê pê tê kê cê mê nê sê šê yê wê rê lê i pi ti ki ci mi ni si ši yi wi ri li î pî tî kî cî mî nî sî šî yî wî rî lî o po to ko co mo no so šo yo wo ro lo ô pô tô kô cô mô nô sô šô yô wô rô lô a pa ta ka ca ma na sa ša ya wa ra la â pâ tâ kâ câ mâ nâ sâ šâ yâ wâ râ lâ -h -p -t -k -c -m -n -s -š -y -w -r -l
请注意,还有单独的元音符号。为了写最后的辅音(CVC 形式),添加最后一行符号,称为“尾音”。所以,“tak”将用两个符号来写:<ta> 和 <-k>。许多音节文字使用这种方法,它基本上局限于只有少量合法尾音的语言。
玛雅音节文字系统使用的另一种尾音系统是“音调和谐原则”。它指出,最后的元音是用重复前一个元音来标记的。例如,一个像“kalo”这样的词,通常用两个符号来写:ka-lo。但是,如果你想写“kal”这个音节,就需要重复前一个元音:ka-la。由于元音被重复,因此在第二个音节中被忽略。这适用于任何元音。但是,如果你想写“kala”这个音节呢?这需要三个音节,再加上一个简单的元音:ka-la-a。第二个“a”被否定,但由下一个音节返回。
第三种系统,由赫梯语使用,包含两组音节,一组为 CV 形式,另一组为 VC 形式。这样,当需要 C1VC2 形式的音节时,就可以写 C1V-VC2,例如,<ka><al> 表示“kal”。此外,当需要将元音变长时,例如“kāl”,模式就变成了 C1V-V-VC2:<ka><a><al>。对于“kala”,只需写 <ka><la>,因为 /l/ 将移到下一个音节。
有时,但并非总是如此,具有相关性的音节,例如具有相同辅音的音节,看起来很相似。例如,音节“ka”、“ke”、“ki”等可能看起来很相似。在像奥吉布韦语这样的系统中,元音符号通过简单地将符号旋转来改变。
- 克里语(旋转),用于奥吉布韦语、克里语、因纽特语和许多其他北美土著语言;统称为“土著音节文字”。
- 切罗基语
- 埃塞俄比亚语,用于阿姆哈拉语、吉兹语、提格雷语和其他几种语言
- 片假名和平假名,用于日语
- 彝语
- 塞浦路斯语、线性 B 和凯尔特伊比利亚语,均已灭绝
还有许多其他系统。
有一组来自罗马化西班牙之前的文字,处于真正的字母表和音节文字之间的中间类别。在这些文字中,爆破音与后面的元音结合成一个音节符号——例如,有一个 PA 的符号,另一个是 PI 的符号,另一个是 PE 的符号,等等——但所有其他辅音和元音也有单独的符号。在这种系统中,例如,短语“barenarkenti”将用九个符号 <ba> <r> <e> <n> <a> <r> <ke> <n> <ti> 来拼写。事实上,这些系统很可能演变自所谓的冗余字母表,其中爆破音根据后面的元音而有不同的符号,就像古代伊特鲁里亚字母表一样,其中 /k/ 音在 <A> 前写为 <K>,在 <E> 或 <I> 前写为 <C>,在 <U> 前写为 <Q>(伊特鲁里亚语没有 /o/ 音)。
表意文字系统被用于书写汉语、日语、古埃及语、玛雅语、苏美尔语和许多其他语言。古代文明首先创造了表意文字,然后将其发展成其他系统。
在纯粹的表意文字系统(如果自然界中存在这样的系统的话)中,每个符号代表一个语素,即语言中最小的有意义的部分。例如,“手”、“红”、“地方”、“-er”、“-ist”、“un-”和“anti-”都是语素。在表意文字系统中,这些都将有自己的符号。正如你可能想象的那样,大多数语言中都有数千个语素,因此任何表意文字系统中都存在数千个符号。
这些符号并不都是随机的。一般来说,代表可见的想法或事物的词的符号通常是小图画。(请记住,书写一直在发展,因此几千年后,不会留下太多的相似之处!)例如,“太阳”、“月亮”、“人”、“孩子”、“水”、“火”、“左”、“右”、“狗”、“马”、“树”、“花”等词可能被画成图片。
并非所有词都可以这样画。你怎么画“爱”或“-er”或“anti-”呢?不同的语言有不同的方法。在某些情况下,用发音相似的词来代替,例如,用“ant”来表示“anti-”。如果你经常这样做,你就在走向音节文字、辅音字母表或字母表。然而,在某些情况下,会画另一张图片来“解释”新词:例如,你可能会在“ant”旁边画一把长矛来表示“anti-”——长矛意味着你反对,对吧?在古埃及语中,长矛会被作为一个单独的符号放在一边,而在汉语中,长矛会被融入到“ant”符号中,形成一个表示“anti-”的新符号。(这就是为什么埃及语这样的文字有时被称为音义文字,这也是用于混合使用表意文字和其他系统的语言的名称。)这完全取决于你。
事实上,据估计,90% 以上的汉字都是用上述方法形成的:取一个发音相似的现有符号,并融入另一个符号来解释其含义。然而,随着时间的推移,这些字的形状已经固定下来,而且声音和意义发生了很多变化,因此一些字由实际上不再很好地代表其意义或声音的符号组成。
如此庞大的系统注定不会是纯粹的;它的一部分或整个部分可能正在向其他类型的系统转变,而它的不同部分可能正在向不同的方向转变。会有语素由多个没有独立含义的符号来表示,还会有符号代表多个词。
- 汉语
- 日语汉字、韩语汉字和越南 chữ Nôm,所有都是汉字表意文字的借用
- 契丹语,古代东北亚的一种已灭绝的阿尔泰语系语言
- 女真语,满语的前身
- 西夏语,中国西北部的一种古代语言
- 纳西语,云南省的一种缅甸- लो लो语
- 日语
- 朝鲜语(混合使用谚文和汉字的形式)
- 古埃及语
- 卢维语(在古代小亚细亚)
- 苏美尔语
- 阿卡德语
- 玛雅语
- 萨波特克语
- 米斯特克语
- 阿兹特克语
现在,如果你已经决定了想要哪种书写系统,还需要完成三个步骤:书写方向、文字历史和书写媒介。然后,你就可以开始真正的文字创作了。
所有文字都有特定的书写方向。拉丁语从左到右书写。希伯来语和阿拉伯语从右到左书写。蒙古语从上到下书写。这些是地球上真实文字中主要的方向类型。
- 从左到右:英语、西里尔字母、希腊语和许多其他系统。
- 从右到左:希伯来语、阿拉伯语、乌尔都语、亚述语和其他几个系统。
- 从上到下:蒙古语,有时也用于汉语
- 牛耕式:古希腊语
“牛耕式书写”(Boustrophedon)指的是一种书写方式,其中一行文字从左到右阅读,下一行从右到左阅读,再下一行又从左到右阅读,以此类推。
THIS IS AN EXAMPLE ИI HƧI˩GИƎ FO BOUSTROPHEDON .Ǝ˩YTƧ
需要注意的是,在古希腊语中,一种牛耕式语言,有时字母在反方向阅读时会实际翻转过来。例如,希腊字母
如果你想坚持使用上述方法之一,可以继续。大多数文字都使用它们。下面描述了几个更复杂的系统。
一些文字可以向多个方向书写,即从左到右、从右到左和从上到下都是可以接受的。汉语和古埃及语就是这样的。在古埃及语中,所有带有面部特征的象形文字都朝向开始阅读的方向。所以,如果你从右到左阅读,所有带有面部特征(或可辨认的正面)的象形文字都会“面向”右侧。在汉语中,必须通过上下文来确定方向。
另一个系统是“旋转式”系统,这是一个非常罕见的系统。据我们所知,只有这一个文字系统使用过它,rongorongo(复活节岛文字)。它类似于牛耕式书写,但字母在每行之后还会旋转 180 度!如果你在每行之后将阅读板旋转一下,它们看起来就会正常。以下是用英文字母的示例:
一些其他的想法,据我们所知,还没有被使用。
- 螺旋式,向内或向外。
- 以顺时针或逆时针方向写圆圈,在写每个字时旋转它;本质上是从左到右或从右到左,但每一句话都在最后一个环的外面。
- 顶点式;句子的每个部分都在它自己的行上,指向一个所有句子都汇聚的顶点。
文字史
[edit | edit source]文字不是一成不变的。它们不断变化,就像语言一样。比较一下古埃及象形文字和现代拉丁文字。信不信由你,现代拉丁文字最终源于 *原西奈文字*,这是一组小型的埃及象形文字。这些象形文字后来被腓尼基人采用,并被大大简化,每个象形文字都分配了一个单一的音节。由于与腓尼基人有着密切的接触,希腊人很快也采用了他们的字母,但改变了他们的一些辅音字母,将代表希腊语中不存在的音节的辅音字母变成了希腊语的元音符号。在某个时间,尽管我们不完全清楚原因,希腊语开始使用牛耕式书写而不是从右到左书写,最终坚持使用从左到右书写。当这种转变发生时,所有字母都水平翻转过来,形成了现在的希腊字母。然后,伊特鲁里亚人和意大利半岛上的拉丁人采用了希腊字母,并进行了微小的修改,拉丁字母最终成为现在欧洲大部分地区使用的文字。斯拉夫字母也源于希腊字母,这是因为俄国人皈依了东正教,在经过大约 1000 年的变革后,现代斯拉夫字母出现了。
字母“A”的简史 | |||||
---|---|---|---|---|---|
埃及象形文字牛头 | 原闪族文字牛头 | 腓尼基语 *aleph* | 希腊语 Alpha | 伊特鲁里亚语 A | 罗马语 A |
在原西奈文字和腓尼基语中,这个字母代表喉塞音 /?/, 但希腊语中没有这个音节,所以它变成了 /a/。
“A”最初是 “aleph”,即牛。后来身体消失了,只剩下头部。然后头部被简化为一条简单的线,保留了最具识别度的部分(角)。最终,角穿透了这条线,字母在腓尼基语中翻转到了侧面。在希腊语中,它再次翻转,在几条线被修剪后,它变成了现代拉丁语/希腊语/斯拉夫语的“A”。
注意复杂性的变化。早期的文字几乎可以肯定是一种象形文字,每个符号代表的正是它看起来的样子。但是,随着时间的推移,文字传播开来,对许多人来说,这仅仅成了毫无意义的复杂性。符号开始简化,有时变成了字母。当一个识字的人开始与一个不识字的人进行贸易时,他们的书写系统就有一个很好的机会传播开来。有时,一种文字会胜过另一种文字。例如,在古代印度,主要使用两种文字:婆罗米文和佉卢文,但佉卢文已经不再使用,现在印度和东南亚部分地区的主要文字都是婆罗米文的演变而来。
有时,早期的象形文字系统并没有简化多少。在古代汉语文字中,汉字发生了变化,但许多汉字并没有像原西奈文字那样显著地简化。现代汉语的表意文字系统仍然非常复杂。1949 年的主要改革是由中国政府推行的。
需要注意的是,欧洲的文字种类繁多,而东南亚的文字种类却相对较少。几乎整个欧洲都使用拉丁字母或斯拉夫字母,但在东南亚,每个国家都至少有一种自己的文字。这可能是因为罗马帝国的存在。罗马人统一了大部分欧洲,并在他们衰落之前建立了自己的文字系统,他们的文字一直保留下来。东南亚不存在这样的帝国,因此出现了种类繁多的文字。
所以,基本上,当古代象形文字系统不再只是供祭司使用时,它们就会简化,因此可以简写。对于普通人来说,仔细地细化每个符号只是一项浪费时间的事情。这在今天仍然适用,只是程度较轻,但这正是草书的来源。甚至古埃及象形文字也有高度简化的形式,被称为“草书”,这种文字被普通人使用。你可以在罗塞塔石碑(右图)的中间部分看到草书(图片在右侧)。
这是一个链接,指向一个好的图表(在维基媒体之外),展示了一个单一符号在东南亚语言中的演变过程:[1]
书写媒介
[edit | edit source]书写文字的表面实际上对文字的影响很大。当刻在石头上时,比如在富萨克文字或其他符文文字中,字母往往非常棱角分明,由直线组成。在石头上刻曲线比在纸上更难。另外,尽管罗塞塔石碑是刻在石头上的,但埃及草书比象形文字要“流畅”得多,而且通常是用纸莎草纸写成的。
古代苏美尔人用泥土写字,用芦苇笔在泥土上刻下符号。这使它具有非常独特的风格。这种类型的书写被称为“楔形文字”。
一些现代语言,如缅甸语,保留了他们过去独特的文字。缅甸语的圆形外形源于它最初是用棕榈叶写成的,如果直线过多,棕榈叶就会撕裂。
在拉丁语、希腊语和斯拉夫语的混合大小写系统(即既有“大写”(大写字母)又有“小写”(小写字母))中,小写字母来自大写字母的草书形式。
现在,如果你已经考虑过你的文字,并选择了一种文字类型、书写方向和书写媒介,那么你现在就可以创建你自己的文字了。