知識ベース

タグ(Unicodeブロック)

タグは、フォーマットタグ文字(言語タグとASCII文字タグ)を含むUnicodeブロックです。

U + E0001、U + E0020–U + E007Fは元々、言語ごとにテキストを目に見えないようにタグ付けすることを目的としていましたが、その使用は推奨されなくなりました。これらの文字はすべてUnicode 5.1で非推奨になりました。

Unicode 8.0のリリースにより、U + E0020–U + E007Eは非推奨の文字ではなくなりました。 「言語タグを表すこと以外の目的でタグ文字を使用する可能性を明確にするために」変更が行われました。 Unicodeは、「プレーンテキストストリームで言語タグを表すためにタグ文字を使用することは、テキストに関する言語情報を伝えるための非推奨のメカニズムである」と述べています。

Unicode 9.0のリリースにより、U + E007Fは非推奨の文字ではなくなりました。 (U + E0001 LANGUAGE TAGは非推奨のままです。)2017年3月のEmoji 5.0のリリースでは、これらの文字は特別なシーケンスの修飾子として使用するための絵文字と見なされます。指定されている唯一の使用法は、国旗の地域インジケータ記号の使用と一緒に、地域の国旗を表すためです。これらのシーケンスは、U + 1F3F4?WAVING BLACK FLAG、それに続くCLDRでコード化された領域に対応するタグのシーケンス、U + E007F CANCEL TAGで構成されます。たとえば、「gbeng」(???????)のタグを使用すると、一部のシステムでイングランドの旗、「gbsct」(???????)の旗がスコットランドの旗、 「gbwls」(???????)ウェールズの旗。このメカニズムを使用すると、他のサブナショナルフラグ(たとえば、米国の州)を表すシーケンスも可能ですが、Unicodeバージョン12.0では、上記の3つのフラグシーケンスのみがUnicodeコンソーシアムによって「一般的な交換に推奨」されます。複数のプラットフォームで広くサポートされます」。

タグ
公式Unicodeコンソーシアムコードチャート(PDF)
0 1 2 3 4 5 6 7 8 9 A B C D E F
U + E000x ラング
U + E001x
U + E002x SP $ ' * + - /
U + E003x 0 1 2 3 4 5 6 7 8 9 = >
U + E004x @ A B C D E F G H J K L M N O
U + E005x P Q R S T うん V W バツ Y Z ^ _
U + E006x ` a b c d e f g h j k l m n o
U + E007x p q r s t あなたは v w バツ y z { | } 終わり
1. ^ Unicodeバージョン12.0以降2. ^灰色の領域は割り当てられていないコードポイントを示します3. ^ UnicodeコードポイントU + E0001およびU + E0020〜U + E007Fは、Unicodeバージョン5.1で非推奨になりましたが、Unicodeバージョン9.0以降のみU + E0001は非推奨のまま

歴史

次のUnicode関連ドキュメントには、Tagsブロックで特定の文字を定義する目的とプロセスが記録されています。

最終的なコードポイントカウント L2 ID WG2 ID 資料
3.1 U + E0001 1 L2 / 97-203 ウィスラー、ケン。 Adams、Glenn(1997-08-05)、 汎用タグのプレーン14文字
L2 / 97-171R2 ウィスラー、ケン(1997-09-18)、 一般的なタグのプレーン14文字
L2 / 97-256 Allouche、Mati(1997-10-20)、 Plane 14 Position Paperに関するコメント
L2 / 97-255R Aliprand、Joan(1997-12-03)、「3.B。Lightweight language tagging」、 承認済み議事録 -UTC #73&L2#170合同会議、カリフォルニア州パロアルト-1997年8月4〜5日
L2 / 98-027 N1670 言語タグの平面14文字 、1997-12-12
L2 / 98-039 Aliprand、Joan;ウィンクラー、アーノルド(1998-02-24)、「2.C改訂提案」、 予備議事録 -UTC #74&L2#171、マウンテンビュー、カリフォルニア-1997年12月5日
L2 / 98-286 N1703 ウママヘシュワラン、VS; Ksar、マイク(1998-07-02)、「7.4」、 未確認の会議議事録、WG 2会議#34、レドモンド、ワシントン、米国; 1998-03-16--20
L2 / 98-281R(pdf、html) Aliprand、Joan(1998-07-31)、「IETFおよびW3Cの問題(VI)」、 未確認議事録-UTC#77およびNCITSサブグループL2#174合同会議、レドモンド、ワシントン州-1998年7月29-31日
L2 / 00-010 N2103 Umamaheswaran、VS(2000-01-05)、「9.1」、 WG 2会議議事録37、コペンハーゲン、デンマーク:1999-09-13--16
L2 / 01-301 ウィスラー、ケン(2001-08-01)、「タグ文字」、 Unicode標準の文字非推奨の分析
L2 / 02-166R2 ムーア、リサ(2002-08-09)、「Character Deprecation」、 UTC#91分
U + E0020..E007F 96 L2 / 16-042 フォント、アグスティン; Pournader、Roozbeh(2015-01-26)、 「完全な絵文字データ」および絵文字フラグの要求の明確化
L2 / 15-145R エドバーグ、ピーター(2015-05-07)、 追加の地域インジケーターシンボルの提案
L2 / 15-107 ムーア、リサ(2015-05-12)、「E.1.3追加の地域インジケーターシンボルの提案」、 UTC#143分
L2 / 15-190 エドバーグ、ピーター(2015-06-29)、 PRI#299背景:追加の種類のフラグの表現
L2 / 15-206 Davis、Mark(2015-07-25)、 Region / Subdivision valid for flags
L2 / 16-180R バージ、ジェレミー。ウィリアムズ、オーウェン(2016-07-07)、 イングランド、スコットランド、ウェールズの絵文字フラグを含める提案
L2 / 17-016 ムーア、リサ(2017-02-08)、「アクションアイテム150-A59」、 UTC#150分 、L2 / 16-180Rで文書化されたフラグの3つのシーケンスを絵文字5.0のemoji-sequences.txtに追加します。
L2 / 17-048 Pournader、Roozbeh(2017-01-24)、 PRI 343に関するフィードバック(Unicode Emoji 5.0)
L2 / 17-086 バージ、ジェレミー。等。 (2017-03-27)、 ZWJ、VS-16、キーキャップとタグをEmoji_Componentに追加
L2 / 17-103 ムーア、リサ(2017-05-18)、「E.1.7 Emoji_ComponentにZWJ、VS-16、キーキャップとタグを追加する」、 UTC#151分
  1. ^提案されたコードポイントとキャラクター名は、最終的なコードポイントと名前と異なる場合があります