タグ(Unicodeブロック)
タグは、フォーマットタグ文字(言語タグとASCII文字タグ)を含むUnicodeブロックです。
U + E0001、U + E0020–U + E007Fは元々、言語ごとにテキストを目に見えないようにタグ付けすることを目的としていましたが、その使用は推奨されなくなりました。これらの文字はすべてUnicode 5.1で非推奨になりました。
Unicode 8.0のリリースにより、U + E0020–U + E007Eは非推奨の文字ではなくなりました。 「言語タグを表すこと以外の目的でタグ文字を使用する可能性を明確にするために」変更が行われました。 Unicodeは、「プレーンテキストストリームで言語タグを表すためにタグ文字を使用することは、テキストに関する言語情報を伝えるための非推奨のメカニズムである」と述べています。
Unicode 9.0のリリースにより、U + E007Fは非推奨の文字ではなくなりました。 (U + E0001 LANGUAGE TAGは非推奨のままです。)2017年3月のEmoji 5.0のリリースでは、これらの文字は特別なシーケンスの修飾子として使用するための絵文字と見なされます。指定されている唯一の使用法は、国旗の地域インジケータ記号の使用と一緒に、地域の国旗を表すためです。これらのシーケンスは、U + 1F3F4?WAVING BLACK FLAG、それに続くCLDRでコード化された領域に対応するタグのシーケンス、U + E007F CANCEL TAGで構成されます。たとえば、「gbeng」(???????)のタグを使用すると、一部のシステムでイングランドの旗、「gbsct」(???????)の旗がスコットランドの旗、 「gbwls」(???????)ウェールズの旗。このメカニズムを使用すると、他のサブナショナルフラグ(たとえば、米国の州)を表すシーケンスも可能ですが、Unicodeバージョン12.0では、上記の3つのフラグシーケンスのみがUnicodeコンソーシアムによって「一般的な交換に推奨」されます。複数のプラットフォームで広くサポートされます」。
タグ 公式Unicodeコンソーシアムコードチャート(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U + E000x | ラング | |||||||||||||||
U + E001x | ||||||||||||||||
U + E002x | SP | ! | 」 | # | $ | % | & | ' | ( | ) | * | + | 、 | - | 。 | / |
U + E003x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | : | = | > | ? | |
U + E004x | @ | A | B | C | D | E | F | G | H | 私 | J | K | L | M | N | O |
U + E005x | P | Q | R | S | T | うん | V | W | バツ | Y | Z | ^ | _ | |||
U + E006x | ` | a | b | c | d | e | f | g | h | 私 | j | k | l | m | n | o |
U + E007x | p | q | r | s | t | あなたは | v | w | バツ | y | z | { | | | } | 〜 | 終わり |
注 1. ^ Unicodeバージョン12.0以降2. ^灰色の領域は割り当てられていないコードポイントを示します3. ^ UnicodeコードポイントU + E0001およびU + E0020〜U + E007Fは、Unicodeバージョン5.1で非推奨になりましたが、Unicodeバージョン9.0以降のみU + E0001は非推奨のまま |
歴史
次のUnicode関連ドキュメントには、Tagsブロックで特定の文字を定義する目的とプロセスが記録されています。
版 | 最終的なコードポイント | カウント | L2 ID | WG2 ID | 資料 |
---|---|---|---|---|---|
3.1 | U + E0001 | 1 | L2 / 97-203 | ウィスラー、ケン。 Adams、Glenn(1997-08-05)、 汎用タグのプレーン14文字 | |
L2 / 97-171R2 | ウィスラー、ケン(1997-09-18)、 一般的なタグのプレーン14文字 | ||||
L2 / 97-256 | Allouche、Mati(1997-10-20)、 Plane 14 Position Paperに関するコメント | ||||
L2 / 97-255R | Aliprand、Joan(1997-12-03)、「3.B。Lightweight language tagging」、 承認済み議事録 -UTC #73&L2#170合同会議、カリフォルニア州パロアルト-1997年8月4〜5日 | ||||
L2 / 98-027 | N1670 | 言語タグの平面14文字 、1997-12-12 | |||
L2 / 98-039 | Aliprand、Joan;ウィンクラー、アーノルド(1998-02-24)、「2.C改訂提案」、 予備議事録 -UTC #74&L2#171、マウンテンビュー、カリフォルニア-1997年12月5日 | ||||
L2 / 98-286 | N1703 | ウママヘシュワラン、VS; Ksar、マイク(1998-07-02)、「7.4」、 未確認の会議議事録、WG 2会議#34、レドモンド、ワシントン、米国; 1998-03-16--20 | |||
L2 / 98-281R(pdf、html) | Aliprand、Joan(1998-07-31)、「IETFおよびW3Cの問題(VI)」、 未確認議事録-UTC#77およびNCITSサブグループL2#174合同会議、レドモンド、ワシントン州-1998年7月29-31日 | ||||
L2 / 00-010 | N2103 | Umamaheswaran、VS(2000-01-05)、「9.1」、 WG 2会議議事録37、コペンハーゲン、デンマーク:1999-09-13--16 | |||
L2 / 01-301 | ウィスラー、ケン(2001-08-01)、「タグ文字」、 Unicode標準の文字非推奨の分析 | ||||
L2 / 02-166R2 | ムーア、リサ(2002-08-09)、「Character Deprecation」、 UTC#91分 | ||||
U + E0020..E007F | 96 | L2 / 16-042 | フォント、アグスティン; Pournader、Roozbeh(2015-01-26)、 「完全な絵文字データ」および絵文字フラグの要求の明確化 | ||
L2 / 15-145R | エドバーグ、ピーター(2015-05-07)、 追加の地域インジケーターシンボルの提案 | ||||
L2 / 15-107 | ムーア、リサ(2015-05-12)、「E.1.3追加の地域インジケーターシンボルの提案」、 UTC#143分 | ||||
L2 / 15-190 | エドバーグ、ピーター(2015-06-29)、 PRI#299背景:追加の種類のフラグの表現 | ||||
L2 / 15-206 | Davis、Mark(2015-07-25)、 Region / Subdivision valid for flags | ||||
L2 / 16-180R | バージ、ジェレミー。ウィリアムズ、オーウェン(2016-07-07)、 イングランド、スコットランド、ウェールズの絵文字フラグを含める提案 | ||||
L2 / 17-016 | ムーア、リサ(2017-02-08)、「アクションアイテム150-A59」、 UTC#150分 、L2 / 16-180Rで文書化されたフラグの3つのシーケンスを絵文字5.0のemoji-sequences.txtに追加します。 | ||||
L2 / 17-048 | Pournader、Roozbeh(2017-01-24)、 PRI 343に関するフィードバック(Unicode Emoji 5.0) | ||||
L2 / 17-086 | バージ、ジェレミー。等。 (2017-03-27)、 ZWJ、VS-16、キーキャップとタグをEmoji_Componentに追加 | ||||
L2 / 17-103 | ムーア、リサ(2017-05-18)、「E.1.7 Emoji_ComponentにZWJ、VS-16、キーキャップとタグを追加する」、 UTC#151分 | ||||
|