古吉拉特語/如何在創建古吉拉特語文字時使用 Unicode
How-tos bookshelf | 如何在創建古吉拉特語文字時使用 Unicode
本頁包含 婆羅米系文字。如果您沒有足够的文字支持,您可能會看到不規則的元音位置和沒有連字。 更多... |
古吉拉特語文字用於書寫 古吉拉特語。這個主題最初是一篇簡短的文章,後來成為了 古吉拉特語文字 的子頁面,最後被標記為 維基教科書 的候選人。在這裡,我們將嘗試處理古吉拉特語文字的略微複雜的 排版,以供非母語使用者,以及它在 Unicode 中的實現方式。由於標準化的優勢,Unicode 已經嘗試使用類似的規則來實現 12 種 南亞文字。這意味著,一旦您了解了如何在創建古吉拉特語文字時使用 Unicode,您就可以將類似的方法應用於其他 印度文字,例如 天城文、孟加拉文、古穆奇文 等;前提是您具有基本知識和相應 書寫系統 的流利度。
古吉拉特語字母主要包括 34 個輔音(裝飾音),2 個被視為輔音的複合字元(雖然在詞彙上不是),以及 14 個元音(純粹音)。總體而言,這個書寫系統包含 94 個合法且公認的獨立符號或形狀。然而,在目前的 Unicode 4.1 實現中,只有其中一些符號被納入字形或形狀。其餘形狀是通過 連字 創建的。
您可以從以下資源獲取有關古吉拉特語和文字的入門知識
給定一個構造好的古吉拉特語音節,它可以根據所涉及的形狀的位置,邏輯地劃分為以下幾個部分。
- 1. 基線區域 - 這是輔音和獨立元音的占位符
- 2. 基線下方和上方的區域 - 分別用於放置下基(基線下方)和上基(基線上方)的從屬元音
- 3. 基線之前和之後的區域 - 分別用於書寫左基(前基)和右基(後基)的從屬元音
範例(從左上角順時針方向):1. 後基(右)2. 下基(下)3. 前基(左)4. 上基(上)。我們將在進一步的討論中使用這些約定。
這裡所指的替換,是指用一個字元或形狀來替換一組或多個字元或形狀。在實務上,這轉換為 - 1) 多個鍵擊將生成一個形狀;以及 2) 生成的形狀將根據使用者的鍵擊或輸入,根據某些規則不斷轉換自身。
當您在基線區域以外的任何位置添加一個或多個形狀時,可能會發生替換(請參閱上圖)。
古吉拉特語文字的 Unicode 範圍是從 U+0A80 到 U+0AFF。古吉拉特語文字的 ISCII 編碼頁識別符是 57010。
下表顯示了 Unicode 標準 4.0.0 中實現的字形。灰色框表示保留/未使用的代碼點。
x= | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F |
U+0A8x | ઁ | ં | ઃ | અ | આ | ઇ | ઈ | ઉ | ઊ | ઋ | ઌ | ઍ | એ | |||
U+0A9x | ઐ | ઑ | ઓ | ઔ | ક | ખ | ગ | ઘ | ઙ | ચ | છ | જ | ઝ | ઞ | ટ | |
U+0AAx | ઠ | ડ | ઢ | ણ | ત | થ | દ | ધ | ન | પ | ફ | બ | ભ | મ | ય | |
U+0ABx | ર | લ | ળ | વ | શ | ષ | સ | હ | ઼ | ઽ | ા | િ | ||||
U+0ACx | ી | ુ | ૂ | ૃ | ૄ | ૅ | ે | ૈ | ૉ | ો | ૌ | ્ | ||||
U+0ADx | ૐ | |||||||||||||||
U+0AEx | ૠ | ૡ | ૢ | ૣ | ૦ | ૧ | ૨ | ૩ | ૪ | ૫ | ૬ | ૭ | ૮ | ૯ | ||
U+0AFx | ૱ |
- 有關 Unicode 代碼點和標準的更多詳細信息,您可以參閱 Unicode 編碼表 - 標準 4.1。
注意:在下述各節中所示的範例中,“+”符號表示鍵擊或使用者輸入的組合。
輔音的半形用於前基位置。對於沒有半形字形的輔音,可以使用Halant(્)來創建半形,如下所示
મ +્ + ય = મ્ય | — 如 રમ્ય(令人愉快的) |
(注意這裡使用的 મ 的半形,它與 ય 連用)注意:即使音節以Halant 結尾,基字形也不會創建半形。
將帶有Halant 的Ra(如上所示的Ra 的半形)應用於前輔音的完整形式輔音會產生該輔音的Reph。這會影響Ra 與該輔音連用時的發音。Reph 可以通過以下方式創建
ર +્ | = Ra + Halant |
ર +્ + થ = ર્થ | — 如 અર્થ (意思) |
(Ra + Halant + થ = Reph 对 થ 的影响)
将辅音的 Halant(辅音的半形)应用于 Ra 的全形会产生该辅音的 Vattu。这会影响 Ra 与该辅音结合时的发音。Vattu 可以按如下方式创建
પ +્ + ર = પ્ર | — 如 પ્રજા (人民) |
(પ + Halant + Ra = Vattu 对 પ 的影响)
Vattu 变体(半形和全形)是在带 vattu 标记的辅音组合时形成的。通常在某些情况下,当各种辅音组合时,需要一个特殊的字形来表示 vattu。
ડ +્ + ર = ડ્ર | — 如 ડ્રમ (鼓) |
(特殊字形 ડ્ર。注意有两个下置标记,而前面的例子只有一个。)
所有上置标记和后置 matra 如下创建
ક +ં = કં | — 如 કંપન (振动) |
下置标记和后置 matra 如下创建
ક +ુ = કુ | — 如 કુતરો (狗) |
ભ +ૂ = ભૂ | — 如 ભૂકંપ (地震) |
以下字符是古吉拉特语字母表的一部分,但在 Unicode 字符集中没有明确地作为字形创建,可以按如下所示生成
શ +્ + ર = શ્ર |
ક +્ + ષ = ક્ષ |
જ +્ + ઞ = જ્ઞ |
Nukta 会影响它所应用到的(前面的)辅音的发音。辅音的 Nukta 形可以在 Unicode 中按如下方式创建
ય +઼ = ય઼ |
以下是解决语言复杂性和生成脚本各种字符形式所需的字符替换
半形连字符是脚本中最常见的现象之一,它们是通过前置替换创建的。
ન +્ + ન = ન્ન | — 如 પ્રસન્ન (快乐) |
此外,这种替换的特殊用法是创建 I-Matra(及其适当对齐的形状),如下所示
ત +િ = તિ | — 如 તિર (箭) |
古吉拉特语脚本的辅音没有后置形式。主要是,后置替换用于从元音创建 visarga,也应用于“I-Matra”替换,如下所示(如果也应用,则将在任何上置替换之前)
જ +ી = જી | — 如 જીવન (生命) |
(将特殊的形状 જી(后置替换的结果)与使用像 લ 这样的字符的类似组合的另一个结果进行比较,它将生成:લ +ી = લી)
上置替换主要应用于 Matra、Reph、元音修改以及重音和音调标记。请考虑以下示例
વ +ૈ = વૈ | — 如 વૈભવ (浮夸) |
ર +્ + ગ +ે = ર્ગે | — 如 સ્વર્ગે (在天堂) |
મ +ે +ં = મેં | — 如 મેંઢક (青蛙) |
主要用于下置 matra,下置替换可能会产生连字符,或改变字形的整体形状。这种替换也用于产生特殊的音调效果,例如 anudatta。
- 有关古吉拉特语 Unicode 的更多信息,您可以参考 Unicode Std 4.0.0 - 第 9 章
- TDIL:印度通信和信息技术部
- 如果您在操作系统语言不是古吉拉特语的情况下创建网页,请将文件另存为 UTF-8 Unicode HTML。否则,代码点可能会丢失。