Etiquetas (bloque Unicode) - Tags (Unicode block)

Etiquetas
Distancia U + E0000..U + E007F
(128 puntos de código)
Plano SSP
Guiones Común
Asignado 97 puntos de código
No usado 31 puntos de código reservados
1 obsoleto
Historial de versiones de Unicode
3,1 (2001) 97 (+97)
Nota :

Etiquetas es un bloque Unicode que contiene caracteres de etiqueta de formato. El bloque está diseñado para reflejar ASCII . Originalmente estaba destinado a etiquetas de idioma, pero ahora se ha reutilizado como modificadores de emoji, específicamente para banderas de región.

Uso heredado

U + E0001, U + E0020 – U + E007F se diseñaron originalmente para etiquetar textos de forma invisible por idioma, pero ese uso ya no se recomienda. Todos esos caracteres quedaron obsoletos en Unicode 5.1.

Con el lanzamiento de Unicode 8.0, U + E0020 – U + E007E ya no son caracteres obsoletos. El cambio se realizó "para despejar el camino para el posible uso futuro de caracteres de etiqueta para un propósito distinto al de representar etiquetas de idioma". Unicode afirma que "el uso de caracteres de etiqueta para representar etiquetas de idioma en un flujo de texto sin formato sigue siendo un mecanismo obsoleto para transmitir información de idioma sobre el texto".

Uso actual

Con el lanzamiento de Unicode 9.0, U + E007F ya no es un personaje obsoleto. (U + E0001 LANGUAGE TAG sigue en desuso). El lanzamiento de Emoji 5.0 en mayo de 2017 considera que estos caracteres son emoji para su uso como modificadores en secuencias especiales.

El único uso especificado es para representar las banderas de las regiones, junto con el uso de símbolos indicadores regionales para las banderas nacionales. Estas secuencias consisten en U + 1F3F4 🏴 BANDERA NEGRA ONDULADA seguida de una secuencia de etiquetas correspondientes a la región codificada en CLDR , luego U + E007F CANCEL TAG . Por ejemplo, el uso de las etiquetas para "gbeng" (🏴󠁧󠁢󠁥󠁮󠁧󠁿) hará que algunos sistemas muestren la bandera de Inglaterra , los de "gbsct" (🏴󠁧󠁢󠁳󠁣󠁴󠁿) la bandera de Escocia y los de "gbwls" (🏴󠁧󠁢󠁷󠁬󠁳󠁿) la bandera de Gales .

Las secuencias de etiquetas se derivan de ISO 3166-2 , pero las secuencias que representan otras banderas subnacionales (por ejemplo, estados de EE. UU. ) También son posibles utilizando este mecanismo, pero a partir de la versión 12.0 de Unicode solo las tres secuencias de banderas enumeradas anteriormente son "Recomendado para intercambio general" por Unicode Consortium, lo que significa que es "más probable que tengan un amplio soporte en múltiples plataformas".

Bloque Unicode

Etiquetas
Tabla de códigos oficial del Consorcio Unicode (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D mi F
U + E000x  EMPEZAR 
U + E001x
U + E002x   SP     !     "     #     PS     %     Y     '     (     )     *     +     ,     -     .     /  
U + E003x   0     1     2     3     4     5     6     7     8     9     :     ;     <     =     >     ?  
U + E004x   @     A     B     C     D     mi     F     GRAMO     H     I     J     K     L     METRO     norte     O  
U + E005x   PAG     Q     R     S     T     U     V     W     X     Y     Z     [     \     ]     ^     _  
U + E006x   '     a     B     C     D     mi     F     gramo     h     I     j     k     l     metro     norte     o  
U + E007x   pag     q     r     s     t     tu     v     w     X     y     z     {     |     }     ~    FIN 
Notas
1. ^ A partir de la versión 13.0 de Unicode
2. ^ Las áreas grises indican puntos de código no asignados
3. ^ Los puntos de código Unicode U + E0001 y U + E0020 a U + E007F quedaron obsoletos con la versión 5.1 de Unicode; sin embargo, a partir de la versión 9.0 de Unicode solo U + E0001 permanece obsoleto

Historia

Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definir caracteres específicos en el bloque Etiquetas:

Versión Puntos de código finales Contar  ID de L2  ID de WG2 Documento
3.1 U + E0001 1 L2 / 97-203 Whistler, Ken; Adams, Glenn (1997-08-05), Plano 14 caracteres para etiquetas genéricas
L2 / 97-171R2 Whistler, Ken ( 18 de septiembre de 1997), Personajes del plano 14 para etiquetas genéricas
L2 / 97-256 Allouche, Mati (1997-10-20), Comentarios sobre el documento de posición del plano 14
L2 / 97-255R Aliprand, Joan (1997-12-03), "3.B. Etiquetado de lenguaje ligero", Actas aprobadas - UTC # 73 y L2 # 170 reunión conjunta, Palo Alto, CA - 4-5 de agosto de 1997
L2 / 98-027 N1670 Plano 14 caracteres para etiquetas de idioma , 12/12/1997
L2 / 98-039 Aliprand, Joan; Winkler, Arnold (1998-02-24), "2.C PROPUESTAS REVISADAS", Acta preliminar - UTC # 74 y L2 # 171, Mountain View, CA - 5 de diciembre de 1997
L2 / 98-286 N1703 Umamaheswaran, VS; Ksar, Mike (1998-07-02), "7.4", Acta de reunión no confirmada, WG 2 Meeting # 34, Redmond, WA, EUA; 1998-03-16-20
L2 / 98-281R (pdf , html ) Aliprand, Joan (1998-07-31), "IETF and W3C Issues (VI)", Actas no confirmadas - UTC # 77 y NCITS Subgrupo L2 # 174 REUNIÓN CONJUNTA, Redmond, WA - 29-31 de julio de 1998
L2 / 00-010 N2103 Umamaheswaran, VS (2000-01-05), "9.1", Acta de la reunión 37 del GT 2, Copenhague, Dinamarca: 1999-09-13-16
L2 / 01-301 Whistler, Ken (2001-08-01), "Etiquetar caracteres", Análisis de la obsolescencia de caracteres en el estándar Unicode
L2 / 02-166R2 Moore, Lisa (2002-08-09), "Desaprovechamiento del personaje", UTC # 91 Minutos
U + E0020..E007F 96 L2 / 16-042 Fuentes, Agustín; Pournader, Roozbeh (26 de enero de 2015), aclaraciones solicitadas para "Datos completos de emojis" y banderas de emojis
L2 / 15-145R Edberg, Peter (2015-05-07), Propuesta de símbolos indicadores regionales adicionales
L2 / 15-107 Moore, Lisa (2015-05-12), "E.1.3 Propuesta de símbolos indicadores regionales adicionales", UTC # 143 Minutos
L2 / 15-190 Edberg, Peter (2015-06-29), PRI # 299 Antecedentes: Representando tipos adicionales de banderas
L2 / 15-206 Davis, Mark (2015-07-25), Validez de región / subdivisión para banderas
L2 / 16-180R Burge, Jeremy ; Williams, Owen (07/07/2016), propuesta para incluir banderas emoji para Inglaterra, Escocia y Gales
L2 / 17-016 Moore, Lisa (2017-02-08), "Action item 150-A59", UTC # 150 Minutes . Agregue las tres secuencias de banderas documentadas en L2 / 16-180R a emoji-sequence.txt para emoji 5.0.
L2 / 17-048 Pournader, Roozbeh (2017-01-24), Comentarios sobre PRI 343 (Unicode Emoji 5.0)
L2 / 17-086 Burge, Jeremy; et al. (2017-03-27), agregue ZWJ, VS-16, teclas y etiquetas a Emoji_Component
L2 / 17-103 Moore, Lisa (2017-05-18), "E.1.7 Agregar ZWJ, VS-16, teclas y etiquetas a Emoji_Component", UTC # 151 Minutos

Referencias