ISO / IEC 8859-2 - ISO/IEC 8859-2
MIME / IANA | ISO-8859-2 |
---|---|
Alias | iso-ir-101, csISOLatin2, latin2, l2, IBM1111 |
Idioma (s) | (vea abajo) |
Estándar | ECMA-94 : 1986, ISO / IEC 8859 |
Clasificación | ASCII extendido , ISO 8859 |
Se extiende | US-ASCII |
Residencia en | ISO-8859-1 |
Otras codificaciones relacionadas | Windows-1250 |
ISO / IEC 8859-2: 1999 , Tecnología de la información - Juegos de caracteres gráficos codificados de un solo byte de 8 bits - Parte 2: Alfabeto latino No. 2 , es parte de la serie ISO / IEC 8859 de codificaciones de caracteres estándar basadas en ASCII , primero edición publicada en 1987. Se le conoce informalmente como "Latin-2". Por lo general, está destinado a los idiomas de Europa central o del este que están escritos en alfabeto latino. Tenga en cuenta que ISO / IEC 8859-2 es muy diferente de la página de códigos 852 (MS-DOS Latin 2, PC Latin 2), que también se conoce como "Latin-2" en las regiones checa y eslovaca. La página de códigos 912 es una extensión.
ISO-8859-2 es el nombre de juego de caracteres preferido de IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO / IEC 6429 . El 0,1% de todas las páginas web utilizan ISO 8859-2 en diciembre de 2018. Microsoft asignó la página de códigos 28592, también conocida como Windows-28592, a ISO-8859-2 en Windows. IBM asignó la página de códigos 1111 a ISO 8859-2.
Windows-1250 es similar a ISO-8859-2 y tiene todos los caracteres imprimibles que tiene y más. Sin embargo, algunos de ellos se reorganizan (a diferencia de Windows-1252 , que mantiene todos los caracteres imprimibles de ISO-8859-1 en el mismo lugar).
Cobertura de idiomas
Estos valores de código se pueden utilizar para los siguientes idiomas:
También se puede usar para rumano , pero no es muy adecuado para ese idioma, debido a que carece de las letras s y t con comas debajo, aunque proporciona s y t con cedillas de aspecto similar . Estas letras se unificaron en las primeras versiones del estándar Unicode , lo que significa que la aparición con cedilla o con una coma se trató como una elección de glifo en lugar de como caracteres separados; Por lo tanto, las fuentes destinadas a usarse con rumano deberían, en teoría, tener caracteres con una coma debajo en esos puntos de código.
Microsoft realmente no proporcionó tales fuentes para las computadoras vendidas en Rumania. Aún así, ISO / IEC 8859-2 y Windows-1250 (con el mismo problema) se han utilizado mucho para rumano. Posteriormente, Unicode desunió las variantes de coma de las variantes de cedilla, y desde entonces ha tomado la delantera para las páginas web, que sin embargo a menudo tienen s y t con cedilla de todos modos. Unicode señala a partir de 2014 que desunir las letras con una coma a continuación fue un error, lo que provocó la corrupción de los datos rumanos: los datos preexistentes y los métodos de entrada aún contendrían los puntos de código de cedilla más antiguos, lo que complicaría la búsqueda de texto.
Diseño de página de códigos
En la siguiente tabla, los caracteres se muestran junto con sus correspondientes puntos de código Unicode . Las diferencias con ISO-8859-1 se muestran con un sombreado más oscuro en la parte superior de sus colores de leyenda.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 |
||||||||||||||||
1_ 16 |
||||||||||||||||
2_ 32 |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
$ 0024 |
% 0025 |
& 0026 |
« 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ 48 |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
4_ 64 |
@ 0040 |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Yo 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
5_ 80 |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
6_ 96 |
` 0060 |
un 0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
g 0067 |
h 0068 |
yo 0069 |
j 006A |
k 006B |
l 006C |
m 006D |
n 006E |
o 006F |
7_ 112 |
p 0070 |
q 0071 |
r 0072 |
s 0073 |
t 0074 |
u 0075 |
v 0076 |
w 0077 |
x 0078 |
y 0079 |
z 007A |
{ 007B |
| 007C |
} 007D |
~ 007E |
|
8_ 128 |
||||||||||||||||
9_ 144 |
||||||||||||||||
A_ 160 |
NBSP 00A0 |
Ą 0104 |
˘ 02D8 |
Ł 0141 |
¤ 00A4 |
Ľ 013D |
Ś 015A |
§ 00A7 |
¨ 00A8 |
Š 0160 |
Ş 015E |
Ť 0164 |
Ź 0179 |
SHY 00AD |
Ž 017D |
Ż 017B |
B_ 176 |
° 00B0 |
ą 0105 |
˛ 02DB |
ł 0142 |
´ 00B4 |
ľ 013E |
ś 015B |
02C7 |
¸ 00B8 |
š 0161 |
ş 015F |
ť 0165 |
ź 017A |
˝ 02DD |
§ 017E |
ż 017C |
C_ 192 |
Ŕ 0154 |
Á 00C1 |
 00C2 |
Ă 0102 |
Ä 00C4 |
Ĺ 0139 |
Ć 0106 |
Ç 00C7 |
Č 010C |
É 00C9 |
Ę 0118 |
Ë 00CB |
Ì 011A |
Í 00CD |
Î 00CE |
Ď 010E |
D_ 208 |
Đ 0110 |
Ń 0143 |
Ň 0147 |
Ó 00D3 |
Ô 00D4 |
Ő 0150 |
Ö 00D6 |
× 00D7 |
Ř 0158 |
Ů 016E |
Ú 00DA |
Ű 0170 |
Ü 00DC |
Ý 00DD |
Ţ 0162 |
ß 00DF |
E_ 224 |
ŕ 0155 |
á 00E1 |
â 00E2 |
ă 0103 |
ä 00E4 |
ĺ 013A |
ć 0107 |
ç 00E7 |
č 010D |
é 00E9 |
ê 0119 |
ë 00EB |
ě 011B |
í 00ED |
î 00EE |
ď 010F |
F_ 240 |
đ 0111 |
ń 0144 |
ň 0148 |
ó 00F3 |
ô 00F4 |
ő 0151 |
ö 00F6 |
÷ 00F7 |
ř 0159 |
ů 016F |
ú 00FA |
ű 0171 |
ü 00FC |
ý 00FD |
ţ 0163 |
˙ 02D9 |
Carta Número Puntuación Símbolo Otro Indefinido
Ver también
Referencias
enlaces externos
- ISO 8859-2: 1999
- Estándar ECMA-94 : Juegos de caracteres gráficos codificados de un solo byte de 8 bits - Alfabetos latinos No. 1 a No. 4 2da edición (junio de 1986)
- ISO-IR 101 Parte derecha del alfabeto latino No 2 (1 de febrero de 1986)
- Recursos de ISO 8859-2 (Latin 2)