古吉拉特语/如何在创建古吉拉特语脚本中使用 Unicode

介绍

此页面包含婆罗米系文字。如果您没有足够的文本支持，您可能会看到不规则的元音放置和没有连字。更多...

古吉拉特语脚本用于书写古吉拉特语。该主题最初是一个存根，然后成为古吉拉特语脚本下的一个子页面，最后被标记为的候选者。在这里，我们将尝试处理古吉拉特语脚本的略微复杂的排版，针对脚本的非母语使用者，以及它在 Unicode 中的实现方式，这稍微有些复杂。通过标准化的优点，Unicode 试图以类似的规则集来实现十二种南亚文字。这意味着，一旦您知道如何在创建古吉拉特语脚本中使用 Unicode，您就可以将类似的方法应用于其他印度文字，例如天城体、孟加拉语、古木吉语等；前提是您具备基本知识并能熟练使用相应的书写系统。

基础知识

古吉拉特语字母表主要包括 34 个辅音（装饰音），2 个被视为辅音的复合字符（但词典上不是），以及 14 个元音（纯音）。总的来说，书写系统包含 94 个合法且公认的独特符号或形状。然而，在当前的 Unicode 4.1 实现中，只有其中一些符号被纳入字形或形状。剩余的形状是通过连字创建的。

您可以从以下资源获取关于古吉拉特语语言和脚本的入门知识

古吉拉特语符号的框架

给定一个构造的古吉拉特语音节，它可以根据所涉及形状的位置逻辑地划分为以下部分。

1. 基线区域 - 这是辅音和独立元音的占位符
2. 基线下方的区域 - 用于放置下部（基线下部）和上部（基线上部）的从属元音
3. 基线之前和之后的区域 - 用于书写左部（前基）和右部（后基）的从属元音

示例（从左上角顺时针）：1. 后基（右）2. 下基（下）3. 前基（左）4. 上基（上）。我们将在进一步的讨论中使用这些约定。

什么是替换？

替换，在此适用的意义上，意味着用单个字符或形状替换一组或一组字符或形状。在实际应用中，这转化为 - 1) 多个按键操作会生成一个形状；以及 2) 生成的形状会根据用户的按键操作或输入，根据某些规则进行自我转换。

当您在除基线区域之外的任何位置添加一个或多个形状时，可能会发生替换（请参阅上面的插图）。

Unicode 代码集

古吉拉特语脚本的 Unicode 范围从 U+0A80 到 U+0AFF。古吉拉特语脚本的 ISCII 代码页标识符是 57010。

下表显示了在 Unicode 标准 4.0.0 中实现的字形。灰色框表示保留/未使用的代码点。

x=

0

1

2

3

4

5

6

7

8

9

A

B

C

D

E

F

U+0A8x

ઁ

ં

ઃ

અ

આ

ઇ

ઈ

ઉ

ઊ

ઋ

ઌ

ઍ

એ

U+0A9x

ઐ

ઑ

ઓ

ઔ

ક

ખ

ગ

ઘ

ઙ

ચ

છ

જ

ઝ

ઞ

ટ

U+0AAx

ઠ

ડ

ઢ

ણ

ત

થ

દ

ધ

ન

પ

ફ

બ

ભ

મ

ય

U+0ABx

ર

લ

ળ

વ

શ

ષ

સ

હ

઼

ઽ

ા

િ

U+0ACx

ી

ુ

ૂ

ૃ

ૄ

ૅ

ે

ૈ

ૉ

ો

ૌ

્

U+0ADx

ૐ

U+0AEx

ૠ

ૡ

ૢ

ૣ

૦

૧

૨

૩

૪

૫

૬

૭

૮

૯

U+0AFx

૱

有关 Unicode 代码点和标准的更多详细信息，您可以参考 Unicode 代码表 - 标准 4.1。

示例

注意：在下文中显示的示例中，“+”符号表示按键操作或用户输入的组合。

辅音的半形

辅音半形用于前置位置。对于没有独立半形字形的辅音，可以使用Halant（્）来创建半形，如下所示

મ +્ + ય = મ્ય

— 如 રમ્ય（令人愉悦）

（注意这里使用的 મ 的半形，它与 ય 结合使用）注意：即使音节以Halant结尾，也不会为基字形创建半形。

Ra的上置形式的应用 – （Reph）

在辅音之前将带有Halant（如上所示的Ra 的半形）的Ra 应用于全形辅音会产生该辅音的Reph。这会影响Ra 与该辅音结合时的发音。Reph 可以如下创建

ર +્	= Ra + Halant
ર +્ + થ = ર્થ	— 如 અર્થ（意义）

（Ra + Halant + થ = Reph 对 થ 的影响）

Ra 的下置形式的应用 – （Vattu）

将辅音的Halant（辅音的半形）应用于Ra 的全形会产生该辅音的Vattu。这会影响Ra 与该辅音结合时的发音。Vattu 可以如下创建

પ +્ + ર = પ્ર

— 如 પ્રજા（人民）

（પ + Halant + Ra = Vattu 对 પ 的影响）

Vattu 变体

Vattu 变体（半形和全形）是在带有vattu 标记的辅音组合时形成的。在某些情况下，当各种辅音组合时，需要特殊的字形来表示vattu。

ડ +્ + ર = ડ્ર

— 如 ડ્રમ（鼓）

（特殊字形 ડ્ર。注意有两个下置标记，而之前的例子只有一个。）

特殊标记、字符和Nukta

上置标记

所有上置标记和后置matra 如下创建

ક +ં = કં

— 如 કંપન（振动）

下置标记

下置标记和后置matra 如下创建

ક +ુ = કુ	— 如 કુતરો（狗）
ભ +ૂ = ભૂ	— 如 ભૂકંપ（地震）

字符 શ્ર、ક્ષ 和 જ્ઞ

以下字符是古吉拉特语字母表的一部分，但 Unicode 字符集中没有明确创建为字形，可以如下生成

શ +્ + ર = શ્ર

ક +્ + ષ = ક્ષ

જ +્ + ઞ = જ્ઞ

Nukta 的应用

Nukta 影响它所应用的（前面的）辅音的发音。辅音的Nukta 形式可以在 Unicode 中如下创建

ય +઼ = ય઼

用于脚本特定排版的替代

以下是解决语言复杂性和生成脚本各种字符形式所需的字符主要替代

前置替代

半形连词是脚本中最常见的用法之一，它们通过前置替代来创建。

ન +્ + ન = ન્ન

— 如 પ્રસન્ન（高兴）

此外，这种替代的特殊用法是在创建I-Matra（及其适当对齐的形状）时，如下所示

ત +િ = તિ

— 如 તિર（箭头）

后置替代

古吉拉特语脚本的辅音没有后置形式。主要使用后置替代来从元音创建visarga，也用于“I-Matra”替代，如下所示（如果也应用，它将在任何上置替代之前）

જ +ી = જી

— 如 જીવન（生活）

（将特殊形状 જી - 后置替代的结果 - 与使用像 લ 这样的字符产生的类似组合的另一个结果进行比较，它将生成：લ +ી = લી）

上置替代

上置替代主要用于Matra、Reph、元音修改以及重音和音调标记。请考虑以下示例

વ +ૈ = વૈ	— 如 વૈભવ（浮夸）
ર +્ + ગ +ે = ર્ગે	— 如 સ્વર્ગે（在天堂）
મ +ે +ં = મેં	— 如 મેંઢક（青蛙）

下置替代

主要用于下置matra，下置替代可以产生连词，或改变字形的整体形状。这种替代也用于产生特殊的音调效果，如anudatta。

有关古吉拉特语 Unicode 的更多详细信息

有关古吉拉特语 Unicode 的更多详细信息，您可以参考 Unicode Std 4.0.0 - 第 9 章
TDIL：印度通信与信息技术部
如果您在操作系统语言不是古吉拉特语的情况下创建网页，请将文件保存为 UTF-8 Unicode HTML。否则代码点可能会丢失。