ISO / IEC 8859-2 - ISO/IEC 8859-2

ISO / IEC 8859-2
MIME / IANA	ISO-8859-2
Alias	iso-ir-101, csISOLatin2, latin2, l2, IBM1111
Idioma (s)	(vea abajo)
Estándar	ECMA-94 : 1986, ISO / IEC 8859
Clasificación	ASCII extendido , ISO 8859
Se extiende	US-ASCII
Residencia en	ISO-8859-1
Otras codificaciones relacionadas	Windows-1250
	v; t; mi;

ISO / IEC 8859-2: 1999 , Tecnología de la información - Juegos de caracteres gráficos codificados de un solo byte de 8 bits - Parte 2: Alfabeto latino No. 2 , es parte de la serie ISO / IEC 8859 de codificaciones de caracteres estándar basadas en ASCII , primero edición publicada en 1987. Se le conoce informalmente como "Latin-2". Por lo general, está destinado a los idiomas de Europa central o del este que están escritos en alfabeto latino. Tenga en cuenta que ISO / IEC 8859-2 es muy diferente de la página de códigos 852 (MS-DOS Latin 2, PC Latin 2), que también se conoce como "Latin-2" en las regiones checa y eslovaca. La página de códigos 912 es una extensión.

ISO-8859-2 es el nombre de juego de caracteres preferido de IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO / IEC 6429 . El 0,1% de todas las páginas web utilizan ISO 8859-2 en diciembre de 2018. Microsoft asignó la página de códigos 28592, también conocida como Windows-28592, a ISO-8859-2 en Windows. IBM asignó la página de códigos 1111 a ISO 8859-2.

Windows-1250 es similar a ISO-8859-2 y tiene todos los caracteres imprimibles que tiene y más. Sin embargo, algunos de ellos se reorganizan (a diferencia de Windows-1252 , que mantiene todos los caracteres imprimibles de ISO-8859-1 en el mismo lugar).

Cobertura de idiomas

Estos valores de código se pueden utilizar para los siguientes idiomas:

También se puede usar para rumano , pero no es muy adecuado para ese idioma, debido a que carece de las letras s y t con comas debajo, aunque proporciona s y t con cedillas de aspecto similar . Estas letras se unificaron en las primeras versiones del estándar Unicode , lo que significa que la aparición con cedilla o con una coma se trató como una elección de glifo en lugar de como caracteres separados; Por lo tanto, las fuentes destinadas a usarse con rumano deberían, en teoría, tener caracteres con una coma debajo en esos puntos de código.

Microsoft realmente no proporcionó tales fuentes para las computadoras vendidas en Rumania. Aún así, ISO / IEC 8859-2 y Windows-1250 (con el mismo problema) se han utilizado mucho para rumano. Posteriormente, Unicode desunió las variantes de coma de las variantes de cedilla, y desde entonces ha tomado la delantera para las páginas web, que sin embargo a menudo tienen s y t con cedilla de todos modos. Unicode señala a partir de 2014 que desunir las letras con una coma a continuación fue un error, lo que provocó la corrupción de los datos rumanos: los datos preexistentes y los métodos de entrada aún contendrían los puntos de código de cedilla más antiguos, lo que complicaría la búsqueda de texto.

Diseño de página de códigos

En la siguiente tabla, los caracteres se muestran junto con sus correspondientes puntos de código Unicode . Las diferencias con ISO-8859-1 se muestran con un sombreado más oscuro en la parte superior de sus colores de leyenda.

ISO / IEC 8859-2 (latín-2)
	_0	_1	_2	_3	_4	_5	_6	_7	_8	_9	_A	_B	_C	_D	_MI	_F
0_ 0
1_ 16
2_ 32	SP 0020	! 0021	" 0022	# 0023	$ 0024	% 0025	& 0026	« 0027	( 0028	) 0029	* 002A	+ 002B	, 002C	- 002D	. 002E	/ 002F
3_ 48	0 0030	1 0031	2 0032	3 0033	4 0034	5 0035	6 0036	7 0037	8 0038	9 0039	: 003A	; 003B	< 003C	= 003D	> 003E	? 003F
4_ 64	@ 0040	A 0041	B 0042	C 0043	D 0044	E 0045	F 0046	G 0047	H 0048	Yo 0049	J 004A	K 004B	L 004C	M 004D	N 004E	O 004F
5_ 80	P 0050	Q 0051	R 0052	S 0053	T 0054	U 0055	V 0056	W 0057	X 0058	Y 0059	Z 005A	[ 005B	\ 005C	] 005D	^ 005E	_ 005F
6_ 96	` 0060	un 0061	b 0062	c 0063	d 0064	e 0065	f 0066	g 0067	h 0068	yo 0069	j 006A	k 006B	l 006C	m 006D	n 006E	o 006F
7_ 112	p 0070	q 0071	r 0072	s 0073	t 0074	u 0075	v 0076	w 0077	x 0078	y 0079	z 007A	{ 007B	\| 007C	} 007D	~ 007E
8_ 128
9_ 144
A_ 160	NBSP 00A0	Ą 0104	˘ 02D8	Ł 0141	¤ 00A4	Ľ 013D	Ś 015A	§ 00A7	¨ 00A8	Š 0160	Ş 015E	Ť 0164	Ź 0179	SHY 00AD	Ž 017D	Ż 017B
B_ 176	° 00B0	ą 0105	˛ 02DB	ł 0142	´ 00B4	ľ 013E	ś 015B	02C7	¸ 00B8	š 0161	ş 015F	ť 0165	ź 017A	˝ 02DD	§ 017E	ż 017C
C_ 192	Ŕ 0154	Á 00C1	Â 00C2	Ă 0102	Ä 00C4	Ĺ 0139	Ć 0106	Ç 00C7	Č 010C	É 00C9	Ę 0118	Ë 00CB	Ì 011A	Í 00CD	Î 00CE	Ď 010E
D_ 208	Đ 0110	Ń 0143	Ň 0147	Ó 00D3	Ô 00D4	Ő 0150	Ö 00D6	× 00D7	Ř 0158	Ů 016E	Ú 00DA	Ű 0170	Ü 00DC	Ý 00DD	Ţ 0162	ß 00DF
E_ 224	ŕ 0155	á 00E1	â 00E2	ă 0103	ä 00E4	ĺ 013A	ć 0107	ç 00E7	č 010D	é 00E9	ê 0119	ë 00EB	ě 011B	í 00ED	î 00EE	ď 010F
F_ 240	đ 0111	ń 0144	ň 0148	ó 00F3	ô 00F4	ő 0151	ö 00F6	÷ 00F7	ř 0159	ů 016F	ú 00FA	ű 0171	ü 00FC	ý 00FD	ţ 0163	˙ 02D9

Carta Número Puntuación Símbolo Otro Indefinido

Ver también

Referencias

enlaces externos

ISO 8859-2: 1999
Estándar ECMA-94 : Juegos de caracteres gráficos codificados de un solo byte de 8 bits - Alfabetos latinos No. 1 a No. 4 2da edición (junio de 1986)
ISO-IR 101 Parte derecha del alfabeto latino No 2 (1 de febrero de 1986)
Recursos de ISO 8859-2 (Latin 2)

Languages

In other projects