知識ベース

ISO 11940

ISO 11940は、タイ文字の音訳のISO標準であり、1998年に発行され、2003年9月に更新され、2008年に確認されました。

子音

タイ語
ISO k うんああ kh うんああ ng c ああ ch s ああ
タイ語
ISO ああああああ d t ああ番目ああ n
タイ語
ISO b p うん ph f うん m
タイ語 Â
ISO y r v l w ṣ̄ ̄ʹ ̄ ̄ バツ

純粋な子音の音訳は、最初の子音としての通常の発音に由来します。マークされていないhは、吸引された子音を示す有向グラフを形成するために使用されます。子音の上位ペアと下位ペアは、上位子音にマクロンを適用することにより体系的に区別されます。同一の音声機能を持つ子音のさらなる区別は、最も頻度の高いものをマークせずに残し、2番目に共通するものを下のドットでマークし、3番目に共通するものをホーンでマークし、4番目に共通するものを下線でマークすることによって得られます。下のドットの使用は、下のドットで逆屈子音を区別するインド学の慣行と同様の効果がありますが、微妙な違いがあります-dotted tho thongとศ so salaの音訳で、下の点ではありません対応するレトロフレックス子音。子音の音訳は、基本文字、マクロン(存在する場合)の順に入力し、次に下にドット、ホーンまたは「マクロンの下」に入力する必要があります。

trans kho khon 、ฒ tho phuthaoおよびษ so ruesiの 3つの子音だけが音訳でホーンを持ち、1つの子音だけが下線ฑ tho nang monthoを持っています。

母音

タイ語 –ั –ิ –ี –ึ –ื –ุ –ู ฤๅ ฦๅ Â
ISO a ā å ụ̄ あなたはうう e æ o v ɨ y w バツ

文字åは、音訳の出力で指定される唯一の事前構成文字です。

Lakkhangyao (ๅ)は、母音文字ฤおよびwithとの組み合わせでのみ表示されています。標準では、ฤとฦを子音で、 lakkhangyaoを母音で単純にリストしています。孤立したlakkhangyaoは、ストローク( ɨ )付きの小文字「i」で音訳されますが、タイ語、パーリ語、またはサンスクリット語では発生しません。

wo waenei o angの音訳は、完全な母音記号としての使用のためにここに含まれていますが、音訳はそれらの使用方法に依存せず、標準は単に子音でそれらをリストします。

複合母音記号は、構成要素に従って音訳されます。

その他の結合マーク

タイ語 –่ –้ –๊ –๋ –็ –์ –๎ –ํ –ฺ
ISO –̀ –̂ –̌ –̆ –̒ –̥

ヤマカン (–๎)は、上付きのチルダではなく、スペースのチルダで表されることに注意してください。

句読点と数字

タイ語
ISO « ǂ § ǀ ǁ » 0 1 2 3 4 5 6 7 8 9

ISO 11940:1998では、国の文字標準TIS 620-2533もUnicodeバージョン5.0も区別していないにもかかわらず、略語記号paiyannoi (ฯ)を文終止子angkhandiao (ฯ)と区別しています。 Paiyannoiは ǂと音訳され、angkhandiaoは次のように音訳されます|。 paiyannoiangkhandiaoおよびangkhankhu (๚)は、ダブルダガー、垂直バー、またはダンダではなく、クリック子音に使用される文字で音訳されることに注意してください。

文字シーケンス

一般に、文字は左から右に音訳され、文字が同じ水平位置にある場合、上から下に音訳されます。実際、垂直シーケンスは、子音の上下の他のマークに先行するトーンマークとタンタハット (– ์)として単純に指定されます。標準では、セクション4.2の最後で、 sara u (◌ุ、◌ู)とnikkhahit (◌ํ)の組み合わせが発生する可能性があることを否定しています。組み合わせの。これらの規則の効果は、 nikkhahitを除いて、タイ語の子音に付けられたすべての非母音マークがローマ字変換で子音に付けられることです。

標準では、前置母音と子音の転置を試みることはローマ字アルファベットに慣れている人にとっては安心かもしれないと認めていますが、前置母音は転置しないことを推奨しています。

たとえば、ภาษาไทย(RTGS:Phasa Thai)はp̣hās̛̄āịthyに 、เชียงใหม่(RTGS:Chiang Mai)はechīyngıh̄m̀に音訳する必要があります。

バリエーション

原因

標準では、アクセントの入力順序が指定されていますが、すべての入力システムが入力された順序でアクセントを記録するわけではありません。 Unicodeでは、複数のアクセントのある文字に対して2つの正規化された形式が指定されており、音訳されたテキストはこれらの形式のいずれかに格納される可能性が高くなります。これにより、自動逆字訳が複雑になります。 Unicode準拠のプロセスではこのようなバリエーションを正しく処理する必要があるため、このページの音訳は表示しやすいように選択されています。現在のレンダリングシステムでは同等のフォームが異なる方法で表示される場合があります。

多くのフォントは、子音とアクセントの斬新な組み合わせをひどく表示します。たとえば、エストニア語研究所はウェブ上のタイ語への標準の適用の説明を公開していますが、1つの例外を除き、これは標準に準拠しているようです。例外は、マクロンを除いて、子音に対するアクセントが実際に右にオフセットされ、対応する非結合文字として入力されたという印象を与えることです。標準ではコード文字で音訳を指定していますが、この無料の説明から作業している人は、トーンアクセントの間隔形式を使用する必要があることを簡単に推測できます。

ICU(CLDR 1.4.1)

Unicodeが後援するCommon Locale Data Repositoryのバージョン1.4.1に記録されているICU実装では、子音の音訳にホーンではなくプライムを使用します。これは、 kho khon 、ฒ tho phuthao 、ษ so bo ruesiの音訳に影響します。 ฏまた、TではなくTとして、別々に音訳されpatakします

この実装では、仮想のタイ語のスクリプトシーケンス( sara anikkhahit )とのあいまいさを避けるため、 ååではなくに音訳します。 ICU実装は、Unicode正規化の問題を回避する代わりに、ฺ phinthuを音訳します。これには、下線付きの子音に適用すると読みやすさが向上するという副作用があります。

ICUの実装では、ฯ paiyannoi (二重短剣)として、 angkhankhu||として音訳します。 (2つのASCII垂直バー)。 ICU実装はUnicodeを使用しているため、意味分析なしでは、 angkhandiaopaiyannoiを確実に区別できず、そのような試みも行いません。

ICU実装の文字シーケンスは異なります。事前に設定された母音を次の子音に置き換え、メモリに保存されている順序で子音のマークを処理します。 (ほとんどのタイ語の入力方法では、マークが下から上に確実に格納されます。)事前に設定された母音を完全な子音クラスタに置き換えません。子音クラスタを完全に正確に特定することはできません。また、クラスタで母音を転置すると、タイ語のスクリプトに確実に変換できるように追加のシンボルが必要になります。

たとえば、この実装では、ภาษาไทยはp̣hās̄ʹāthịyに音訳し、เชียงใหม่はcheīyngh̄ım̀に音訳します。

最後に、この実装は、Unicode Normalization Form C(NFC)で音訳を生成します。