古吉拉特語/如何在創建古吉拉特語文字時使用 Unicode

How-tos bookshelf | 如何在創建古吉拉特語文字時使用 Unicode

介紹

本頁包含婆羅米系文字。如果您沒有足够的文字支持，您可能會看到不規則的元音位置和沒有連字。更多...

古吉拉特語文字用於書寫古吉拉特語。這個主題最初是一篇簡短的文章，後來成為了古吉拉特語文字的子頁面，最後被標記為維基教科書的候選人。在這裡，我們將嘗試處理古吉拉特語文字的略微複雜的排版，以供非母語使用者，以及它在 Unicode 中的實現方式。由於標準化的優勢，Unicode 已經嘗試使用類似的規則來實現 12 種南亞文字。這意味著，一旦您了解了如何在創建古吉拉特語文字時使用 Unicode，您就可以將類似的方法應用於其他印度文字，例如天城文、孟加拉文、古穆奇文等；前提是您具有基本知識和相應書寫系統的流利度。

基礎知識

古吉拉特語字母主要包括 34 個輔音（裝飾音），2 個被視為輔音的複合字元（雖然在詞彙上不是），以及 14 個元音（純粹音）。總體而言，這個書寫系統包含 94 個合法且公認的獨立符號或形狀。然而，在目前的 Unicode 4.1 實現中，只有其中一些符號被納入字形或形狀。其餘形狀是通過連字創建的。

您可以從以下資源獲取有關古吉拉特語和文字的入門知識

古吉拉特語符號的框架

給定一個構造好的古吉拉特語音節，它可以根據所涉及的形狀的位置，邏輯地劃分為以下幾個部分。

1. 基線區域 - 這是輔音和獨立元音的占位符
2. 基線下方和上方的區域 - 分別用於放置下基（基線下方）和上基（基線上方）的從屬元音
3. 基線之前和之後的區域 - 分別用於書寫左基（前基）和右基（後基）的從屬元音

範例（從左上角順時針方向）：1. 後基（右）2. 下基（下）3. 前基（左）4. 上基（上）。我們將在進一步的討論中使用這些約定。

什麼是替換？

這裡所指的替換，是指用一個字元或形狀來替換一組或多個字元或形狀。在實務上，這轉換為 - 1) 多個鍵擊將生成一個形狀；以及 2) 生成的形狀將根據使用者的鍵擊或輸入，根據某些規則不斷轉換自身。

當您在基線區域以外的任何位置添加一個或多個形狀時，可能會發生替換（請參閱上圖）。

Unicode 編碼集

古吉拉特語文字的 Unicode 範圍是從 U+0A80 到 U+0AFF。古吉拉特語文字的 ISCII 編碼頁識別符是 57010。

下表顯示了 Unicode 標準 4.0.0 中實現的字形。灰色框表示保留/未使用的代碼點。

x=

0

1

2

3

4

5

6

7

8

9

A

B

C

D

E

F

U+0A8x

ઁ

ં

ઃ

અ

આ

ઇ

ઈ

ઉ

ઊ

ઋ

ઌ

ઍ

એ

U+0A9x

ઐ

ઑ

ઓ

ઔ

ક

ખ

ગ

ઘ

ઙ

ચ

છ

જ

ઝ

ઞ

ટ

U+0AAx

ઠ

ડ

ઢ

ણ

ત

થ

દ

ધ

ન

પ

ફ

બ

ભ

મ

ય

U+0ABx

ર

લ

ળ

વ

શ

ષ

સ

હ

઼

ઽ

ા

િ

U+0ACx

ી

ુ

ૂ

ૃ

ૄ

ૅ

ે

ૈ

ૉ

ો

ૌ

્

U+0ADx

ૐ

U+0AEx

ૠ

ૡ

ૢ

ૣ

૦

૧

૨

૩

૪

૫

૬

૭

૮

૯

U+0AFx

૱

有關 Unicode 代碼點和標準的更多詳細信息，您可以參閱 Unicode 編碼表 - 標準 4.1。

範例

注意：在下述各節中所示的範例中，“+”符號表示鍵擊或使用者輸入的組合。

輔音的半形

輔音的半形用於前基位置。對於沒有半形字形的輔音，可以使用Halant（્）來創建半形，如下所示

મ +્ + ય = મ્ય

— 如 રમ્ય（令人愉快的）

（注意這裡使用的 મ 的半形，它與 ય 連用）注意：即使音節以Halant 結尾，基字形也不會創建半形。

Ra 的上基形式的應用 - (Reph)

將帶有Halant 的Ra（如上所示的Ra 的半形）應用於前輔音的完整形式輔音會產生該輔音的Reph。這會影響Ra 與該輔音連用時的發音。Reph 可以通過以下方式創建

ર +્	= Ra + Halant
ર +્ + થ = ર્થ	— 如 અર્થ (意思)

(Ra + Halant + થ = Reph 对 થ 的影响)

Ra 的下置形式的应用 – (Vattu)

将辅音的 Halant（辅音的半形）应用于 Ra 的全形会产生该辅音的 Vattu。这会影响 Ra 与该辅音结合时的发音。Vattu 可以按如下方式创建

પ +્ + ર = પ્ર

— 如 પ્રજા (人民)

(પ + Halant + Ra = Vattu 对 પ 的影响)

Vattu 变体

Vattu 变体（半形和全形）是在带 vattu 标记的辅音组合时形成的。通常在某些情况下，当各种辅音组合时，需要一个特殊的字形来表示 vattu。

ડ +્ + ર = ડ્ર

— 如 ડ્રમ (鼓)

(特殊字形 ડ્ર。注意有两个下置标记，而前面的例子只有一个。)

特殊标记、字符和 Nukta

上置标记

所有上置标记和后置 matra 如下创建

ક +ં = કં

— 如 કંપન (振动)

下置标记

下置标记和后置 matra 如下创建

ક +ુ = કુ	— 如 કુતરો (狗)
ભ +ૂ = ભૂ	— 如 ભૂકંપ (地震)

字符 શ્ર、ક્ષ 和 જ્ઞ

以下字符是古吉拉特语字母表的一部分，但在 Unicode 字符集中没有明确地作为字形创建，可以按如下所示生成

શ +્ + ર = શ્ર

ક +્ + ષ = ક્ષ

જ +્ + ઞ = જ્ઞ

Nukta 的应用

Nukta 会影响它所应用到的（前面的）辅音的发音。辅音的 Nukta 形可以在 Unicode 中按如下方式创建

ય +઼ = ય઼

用于脚本特定排版的替换

以下是解决语言复杂性和生成脚本各种字符形式所需的字符替换

前置替换

半形连字符是脚本中最常见的现象之一，它们是通过前置替换创建的。

ન +્ + ન = ન્ન

— 如 પ્રસન્ન (快乐)

此外，这种替换的特殊用法是创建 I-Matra（及其适当对齐的形状），如下所示

ત +િ = તિ

— 如 તિર (箭)

后置替换

古吉拉特语脚本的辅音没有后置形式。主要是，后置替换用于从元音创建 visarga，也应用于“I-Matra”替换，如下所示（如果也应用，则将在任何上置替换之前）

જ +ી = જી

— 如 જીવન (生命)

(将特殊的形状 જી（后置替换的结果）与使用像 લ 这样的字符的类似组合的另一个结果进行比较，它将生成：લ +ી = લી)

上置替换

上置替换主要应用于 Matra、Reph、元音修改以及重音和音调标记。请考虑以下示例

વ +ૈ = વૈ	— 如 વૈભવ (浮夸)
ર +્ + ગ +ે = ર્ગે	— 如 સ્વર્ગે (在天堂)
મ +ે +ં = મેં	— 如 મેંઢક (青蛙)

下置替换

主要用于下置 matra，下置替换可能会产生连字符，或改变字形的整体形状。这种替换也用于产生特殊的音调效果，例如 anudatta。

关于古吉拉特语 Unicode 的更多信息

有关古吉拉特语 Unicode 的更多信息，您可以参考 Unicode Std 4.0.0 - 第 9 章
TDIL：印度通信和信息技术部
如果您在操作系统语言不是古吉拉特语的情况下创建网页，请将文件另存为 UTF-8 Unicode HTML。否则，代码点可能会丢失。