MIK (juego de caracteres) - MIK (character set)

MIK ( МИК ) es una página de códigos cirílicos de 8 bits utilizada con DOS . Se basa en el juego de caracteres utilizado en el sistema compatible con PC IBM Pravetz 16 de Bulgaria . Kermit llama a este juego de caracteres " BULGARIA-PC " / " bulgaria-pc ". En Bulgaria, a veces se la denominó incorrectamente como página de códigos 856 (que choca con la definición de IBM para una página de códigos hebrea). FreeDOS conoce esta página de códigos como página de códigos 3021 .

Esta es la página de códigos DOS / OEM más extendida que se utiliza en Bulgaria , en lugar de CP 808 , CP 855 , CP 866 o CP 872 .

Casi todos los programas de DOS creados en Bulgaria, que tienen cadenas búlgaras, usaban MIK como codificación, y muchos de estos programas todavía están en uso.

Conjunto de caracteres

Cada carácter se muestra con su punto de código Unicode equivalente y su punto de código decimal. Sólo se muestra la segunda mitad de la tabla (puntos de código 128-255), siendo la primera mitad (puntos de código 0-127) la misma que ASCII .

MIK
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _MI _F
8_ А
0410

128
Б
0411

129
Â
0412

130
Г
0413

131
Д
0414

132
Е
0415

133
Ж
0416

134
З
0417

135
И
0418

136
Й
0419

137
К
041A

138
Л
041B

139
М
041C

140
Н
041D

141
О
041E

142
П
041F

143
9_ Р
0420

144
С
0421

145
Т
0422

146
У
0423

147
Ф
0424

148
Х
0425

149
Ц
0426

150
Ч
0427

151
Ш
0428

152
Щ
0429

153
Ъ
042A

154
Ы
042B

155
Ь
042C

156
Э
042D

157
Ю
042E

158
Я
042F

159
A_ а
0,43 mil

160
б
0431

161
в
0.432 mil

162
г
0433

163
д
0434

164
е
0435

165
ж
0436

166
§
0437

167
и
0438

168
©
0439

169
к
043A

170
л
043B

171
м
043C

172
н
043D

173
о
043E

174
п
043F

175
B_ р
0440

176
с
0441

177
т
0442

178
у
0443

179
ф
0444

180
х
0445

181
ц
0446

182
ч
0447

183
ø
0448

184
щ
0449

185
ъ
044A

186
ы
044B

187
ь
044C

188
э
044D

189
ю
044E

190
я
044F

191
C_
2514

192

2534

193

252C

194

251C

195

2500

196

253C

197

2563

198

2551

199

255A

200

2554

201

2569

202

2.566 mil

203

2560

204

2,55 mil

205

256C

206

2510

207
D_
2591

208

de 2592

209

2,593

210

2502

211

2524

212

2116

213
§
00A7

214

2.557

215

255D

216

2,518 mil

217

250C

218

2588

219

2584

220

258C

221

2590

222

2 580

223
MI_ α
03B1

224
ß
00DF

225
Γ
0393

226
π
03C0

227
Σ
03A3

228
σ
03C3

229
µ
00B5

230
τ
03C4

231
Φ
03A6

232
Θ
0398

233
Ω
03A9

234
δ
03B4

235

221E

236
φ
03C6

237
ε
03B5

238

2229

239
F_
2261

240
±
00B1

241

2265

242

2264

243

2320

244

2321

245
÷
00F7

246

2248

247
°
00B0

248

2219

249
·
00B7

250

221A

251

207F

252
²
00B2

253

25A0

254
NBSP
00A0

255

  Carta  Número  Puntuación  Símbolo  Otro  Indefinido

Notas para los implementadores de tablas de mapeo a Unicode

Los implementadores de tablas de mapeo a Unicode deben tener en cuenta que la página de códigos MIK unifica algunos caracteres:

  1. ^ 0xE1 es tanto la S aguda alemana(U + 00DF, ß) como la beta minúscula griega(U + 03B2, β);
  2. ^ 0xE4 es tanto el signo de suma n-ario (U + 2211, ∑) como la sigma mayúscula griega(U + 03A3, Σ);
  3. ^ 0xE6 es tanto el micro signo (U + 00B5, µ) como la minúscula griega mu (U + 03BC, μ);
  4. ^ 0xEA es tanto elsigno de Ohm (U + 2126, Ω) como la mayúscula griega omega (U + 03A9, Ω);
  5. ^ 0xEE es tanto el elemento de signo (U + 2208, ∈) como la épsilon minúscula griega(U + 03B5, ε)!

Manipulaciones de caracteres binarios

La página de códigos MIK mantiene en orden alfabético todas las letras cirílicas, lo que permite una manipulación de caracteres muy sencilla en forma binaria:

10xx xxxx - es una letra cirílica

100x xxxx - es una letra cirílica mayúscula

101x xxxx - es una letra cirílica minúscula

En tal caso, funciones de prueba y manipulación de caracteres como:

IsAlpha (), IsUpper (), IsLower (), ToUpper () y ToLower (),

son operaciones de bits y la clasificación se realiza mediante una simple comparación de valores de caracteres.

Ver también

Referencias

enlaces externos