Puntuación general - General Punctuation

Puntuación general
Distancia U + 2000..U + 206F
(112 puntos de código)
Plano BMP
Guiones Común (109 caracteres)
Heredado (2 caracteres)
Conjuntos de símbolos Controles de formato de
espacios de puntuación
Asignado 111 puntos de código
No usado 1 puntos de código reservados
6 obsoletos
Historial de versiones de Unicode
1.0.0 (1991) 67 (+67)
1.1 (1993) 76 (+9)
3,0 (1999) 83 (+7)
3.2 (2002) 95 (+12)
4.0 (2003) 97 (+2)
4.1 (2005) 106 (+9)
5.1 (2008) 107 (+1)
6,3 (2013) 111 (+4)
Nota :

Puntuación general es un bloque Unicode que contiene caracteres de puntuación , espaciado y formato para usar con todos los scripts y sistemas de escritura. Se incluyen los espacios de ancho definido , los formatos de unión, los formatos direccionales, las comillas tipográficas, la puntuación arcaica y novedosa como el interrobang y los operadores matemáticos invisibles.

Los caracteres de puntuación adicionales se encuentran en el bloque de puntuación complementario y se esparcen en docenas de otros bloques Unicode.

Cuadra


Tabla de códigos oficial del Consorcio Unicode de puntuación general (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D mi F
U + 200x NQ
 SP 
MQ
 SP 
EN
 SP 
EM
 SP 
 3 / M 
SP
 4 / M 
SP
 6 / M 
SP
F
 SP 
P
 SP 
TH
 SP 
H
 SP 
ZW
 SP 
ZW
 NJ 
 ZW 
J
 LRM   RLM 
U + 201x -  NB 
-
- - - - ' ' " "
U + 202x ... L
 SEP 
P
 SEP 
 LRE   RLE   PDF   LRO   RLO   NNB 
SP
U + 203x
U + 204x
U + 205x MM
  SP  
U + 206x  WJ   ƒ ()    ×     ,     +    LRI   RLI   FSI   PDI  Yo
 SS 
Un
 SS 
Yo
 AFS 
A
 AFS 
NA
 DS 
NO
 DS 
Notas
1. ^ A partir de la versión 14.0 de Unicode
2. ^ El área gris indica un punto de código no asignado
3. ^ Los puntos de código Unicode U + 206A - U + 206F están obsoletos a partir de la versión 3.0 de Unicode

Por lo general, varios caracteres de este bloque no se representan con un glifo directamente visible. Diez caracteres de espacio en blanco U + 2002 a U + 200B ( en fijo o 12 em, em, 13 em, 14 em, 16 em, espacio de cifras y puntuación , variable delgada o 15 em y cabello espacio , espacio fijo de ancho cero ) y U + 205F ( medio matemático o espacio de 29 em ) difieren en el ancho horizontal, mientras que U + 2000 y U + 2001 ( en y em quad ) son efectivamente alias de U + 2002 y U +2003, respectivamente; otros dos, U + 202F y U + 2060 (combinación de palabras mal definidas ) son variantes de U + 2009 o U + 2004 y U + 200B que prohíben los saltos de línea. Tres caracteres de ancho cero U + 200B a U + 200D ( espacio, no ensamblador y ensamblador ) difieren en cómo afectan la ligadura y la forma de letras adyacentes, como las formas contextuales en árabe. Once caracteres invisibles U + 200E, U + 200F (marca de izquierda a derecha y de derecha a izquierda ), U + 202A a U + 202E ( incrustaciones, estallidos y anulaciones ) y U + 2066 a U + 2069 ( aislamientos ) controlar la direccionalidad del texto a menos que el marcado de nivel superior los anule. Hay separadores explícitos de líneas y párrafos en U + 2028 y U + 2029.

Emoji

El bloque de puntuación general contiene dos emoji : U + 203C y U + 2049.

El bloque tiene cuatro variantes estandarizadas definidas para especificar el estilo emoji (U + FE0F VS16) o la presentación de texto (U + FE0E VS15) para los dos emoji, ambos predeterminados en una presentación de texto.

Secuencias de variación de emoji
U + 203C 2049
punto de código base
base + VS15 (texto) ‼ ︎ ⁉︎
base + VS16 (emoji) ‼ ️ ⁉️

Historia

Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definir caracteres específicos en el bloque de puntuación general:

Referencias