知識ベース

MIK(文字セット)

MIKМИК )は、DOSで使用される8ビットのキリル文字コードページです。これは、ブルガリアのPravetz 16 IBM PC互換システムで使用される文字セットに基づいています。カーミットは、この文字セットを「 BULGARIA-PC 」/「 bulgaria-pc 」と呼びます。ブルガリアでは、コードページ856(ヘブライ語のコードページに対するIBMの定義と競合する)と誤って呼ばれることがありました。

これは、CP 808、CP 855、CP 866、CP 872ではなく、ブルガリアで使用されている最も普及しているDOS / OEMコードページです。

ブルガリア文字列を含むブルガリアで作成されたほぼすべてのDOSプログラムは、MIKをエンコードとして使用しており、そのようなプログラムの多くはまだ使用されています。

キャラクターセット

各文字は、同等のUnicodeコードポイントと10進コードポイントで表示されます。表の後半(コードポイント128〜255)のみが表示され、前半(コードポイント0〜127)はASCIIと同じです。

文字番号句読点記号その他未定義

_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _E _F 8_А
0410
128Б
0411
129В
0412
130Г
0413
131Д
0414
132Е
0415
133Ж
0416
134З
0417
135И
0418
136Й
0419
137К
041A
138Л
041B
139М
041C
140Н
041D
141О
041E
142П
041F
143 9_Р
0420
144С
0421
145Т
0422
146У
0423
147Ф
0424
148Х
0425
149Ц
0426
150Ч
0427
151Ш
0428
152Щ
0429
153Ъ
042A
154Ы
042B
155Ь
042C
156Э
042D
157Ю
042E
158Я
042F
159 A_а
0430
160б
0431
161в
0432
162г
0433
163日
0434
164е
0435
165ж
0436
166з
0437
167и
0438
168 ©
0439
169к
043A
170л
043B
171м
043C
172н
043D
173о
043E
174п
043F
175 B_р
0440
176с
0441
177т
0442
178у
0443
179ф
0444
180х
0445
181ц
0446
182ч
0447
183ш
0448
184щ
0449
185ъ
044A
186ы
044B
187ь
044C
188э
044D
189ю
044E
190я
044F
191 C_└
2514
192┴
2534
193┬
252C
194├
251C
195─
2500
196┼
253C
197╣
2563
198║
2551
199╚
255A
200╔
2554
201╩
2569
202╦
2566
203╠
2560
204 =
2550
205╬
256C
206┐
2510
207 D_░
2591
208▒
2592
209▓
2593
210│
2502
211┤
2524
212№
2116
213§
00A7
214╗
2557
215╝
255D
216┘
2518
217┌
250C
218█
2588
219
2584
220▌
258C
221▐
2590
222▀
2580
223 E_α
03B1
224ß
00DF
225Γ
0393
226個の π
03C0
227Σ
03A3
228個の σ
03C3
229 µ
00B5
230τ
03C4
231Φ
03A6
232Θ
0398
233Ω
03A9
234δ
03B4
235∞
221E
236φ
03C6
237ε
03B5
238∩
2229
239 F_≡
2261
240 ±
00B1
241≥
2265
242≤
2264
243⌠
2320
244⌡
2321
245 ÷
00F7
246≈
2248
247 °
00B0
248
2219
249
00B7
250√
221A
251ⁿ
207F
252²
00B2
253
25A0
254 NBSP
00A0
255

テーブルをUnicodeにマッピングする実装者向けの注意事項

Unicodeへのマッピングテーブルの実装者は、MIKコードページは、いくつかの文字を統一することを注意してください。

  1. ^ 0xE1は、ドイツ語のシャープS(U + 00DF、ß)とギリシャ語の小文字ベータ(U + 03B2、β)の両方です。
  2. ^ 0xE4は、n項加算記号(U + 2211、1、)とギリシャ語の大文字シグマ(U + 03A3、Σ)の両方です。
  3. ^ 0xE6は、マイクロ記号(U + 00B5、µ)とギリシャ語の小文字mu(U + 03BC、µ)の両方です。
  4. ^ 0xEAは、オーム記号(U + 2126、Ω)とギリシャ語の大文字オメガ(U + 03A9、Ω)の両方です。
  5. ^ 0xEEは符号の要素(U + 2208、ε)とギリシャ語の小文字イプシロン(U + 03B5、ε)の両方です!

バイナリ文字操作

MIKコードページでは、すべてのキリル文字がアルファベット順に維持されているため、非常に簡単にバイナリ形式で文字を操作できます。

10xx xxxx-キリル文字

100x xxxx-大文字のキリル文字

101x xxxx-小文字のキリル文字

このような場合、テストおよびキャラクター操作機能は次のとおりです。

IsAlpha()、IsUpper()、IsLower()、ToUpper()およびToLower()、

ビット演算であり、ソートは文字値の単純な比較によるものです。