知識ベース

言語コード

言語コードは、文字または数字を言語の識別子または分類子として割り当てるコードです。これらのコードを使用して、ライブラリコレクションまたはデータのプレゼンテーションを整理したり、コンピューティングで正しいローカリゼーションと翻訳を選択したり、より長い形式の言語名の省略表記として使用したりできます。

分類の難しさ

言語コード体系は、人間の言語、方言、および変形の複雑な世界を分類しようとします。ほとんどのスキームは、一般的であることと特定の方言をサポートするのに十分なことの間で妥協します。

たとえば、中央アメリカと南アメリカのほとんどの人はスペイン語を話します。メキシコで話されるスペイン語は、ペルーで話されるスペイン語とわずかに異なります。メキシコの異なる地域では、スペイン語の方言とアクセントがわずかに異なります。言語コード体系では、これらをすべてキーボードレイアウトを選択するための「スペイン語」、一般的な使用法では「スペイン語」としてグループ化するか、各方言を分離して地域固有のイディオムを許可します。

一般的なスキーム

いくつかの一般的な言語コードスキームが含まれます。

スキームノート英語の例スペイン語の例
Glottologコード工業用ISO 639‑3標準の科学的代替として少数言語用に作成されました。
意図的に略語に似てはなりません。
  • stan1293 –標準英語
  • macr1271 –マクロ英語(現代英語、クレオールを含む)
  • midd1317 –中英語
  • merc1242 –メルシャン(中期–現代英語)
  • olde1238 –古英語
  • angl1265 –アングリア(旧–現代英語、スコットランドを含む)
  • stan1288 –標準スペイン語
  • olds1249 –古いスペイン語
  • cast1243 –カスティリク(旧–現代スペイン語、エストレマドゥーランとクレオールを含む)
IETF言語タグ IETFのベストプラクティス。現在、RFC 5646およびRFC 4647で指定されており、コンピューターで簡単に解析できる言語タグ用です。タグシステムは、地域、方言、個人の指定に対して拡張可能です。
  • en –英語、最短ISO 639コード。
  • en-US米国で使用される英語(米国は、米国のISO 3166‑1国コードです)

出典:IETFメモ

  • es –最短ISO 639コードとしてのスペイン語。
  • es-419 –ラテンアメリカおよびカリブ海地域に適したスペイン語、UN M.49地域コードを使用
ISO 639‑1 2002年に公式に作成された2文字のコードシステムには、136のコードが含まれていました。多くのシステムは、2文字のコードが適用できない場合、3文字のISO 639‑2コードで補完された2文字のISO 639‑1コードを使用します。

参照:ISO 639-1コードのリスト

  • en
  • es –スペイン語
ISO 639‑2 464コードの3文字システム。

参照:ISO 639-2コードのリスト

  • eng – 3文字のコード
  • enm –中英語、c。 1100〜1500
  • ang –古英語、c。 450〜1100
  • cpe –他の英語ベースのクレオールとピジン
  • スパ –スペイン語
ISO 639‑3 7,589エントリのすべての既知の言語、生きている言語、死んだ言語、話し言葉、または書き言葉をカバーするISO 639‑2の拡張

参照:ISO 639-3コードのリスト

  • eng – 3文字のコード
  • enm –中英語、c。 1100〜1500
  • aig –アンティグアバーブーダクレオール英語
  • ang –古英語、c。 450〜1100
  • svc –ビンセントクレオール英語
  • スパ –スペイン語
  • spq –スペイン語、ロレートウカヤリ
  • ssp –スペイン語の手話
Linguasphere Registerコードシステム 2000年に公開された2桁+ 1〜6文字のLinguasphere Registerコードシステム。10の参照セクター内に32,000を超えるコードが含まれ、世界の言語と音声コミュニティをカバーしています。

hortensj-garden.orgによってオンラインで公開されたLinguasphere Registerコードシステムの階層もナビゲートします。

Linguasphere Registerコードシステムの階層内:

  • 5 =インドヨーロッパphylosector
  • 52 =ゲルマンフィロゾン
  • 52-Aゲルマンセット
  • 52-AB英語+アングロクレオールチェーン
  • 52-ABA English net
  • 52-ABA-cグローバル英語
    外部ユニット
    52-ABA-ca
    52-ABA-cwe
    (186品種)

比較: 52-ABA-aスコットランド+ノーサンブリア
外部ユニット& 52-ABA-b "Anglo-English"外部ユニット
(=南イギリスの伝統的な品種+オールドアングロアイリッシュ)

Linguasphere Registerコードシステムの階層内:

  • 5 =インドヨーロッパphylosector
  • 51 =ロマンフィロゾン
  • 51-Aロマンスセット
  • 51-AAロマンスチェーン
  • 51-AAAウエストロマンスネット
  • 51-AAA- bEspañol/ Castellano
    外部ユニット
    51-AAA-ba
    51-AAA-bkk
    (58品種)

比較: 51-AAA- aPortuguês+ Galego外部ユニット& 51-AAA-c Astur +Leonés外部ユニットなど

SILコード(10〜14版) 言語統計をリストするSIL Internationalの出版物であるEthnologueで使用するために作成されたコード。この出版物は現在、ISO 639‑3コードを使用しています。 ENG SPN
Verbix言語コード古いSILコードで始まり、さらに情報を追加する構築されたコード。 ENG SPN