Subíndices y superíndices Unicode - Unicode subscripts and superscripts

La diferencia entre los glifos de superíndice / subíndice y numerador / denominador. En muchas fuentes populares, los caracteres de "superíndice" y "subíndice" de Unicode son en realidad glifos de numerador y denominador.

Unicode tiene versiones con subíndice y superíndice de varios caracteres, incluido un conjunto completo de números arábigos . Estos caracteres permiten que cualquier polinomio , químico y otras ecuaciones se representen en texto plano sin utilizar ninguna forma de marcado como HTML o TeX .

El Consorcio World Wide Web y el Consorcio Unicode han hecho recomendaciones sobre la elección entre el uso de marcado y el uso de caracteres de superíndice y subíndice:

Cuando se utiliza en contexto matemático ( MathML ), se recomienda utilizar de forma coherente el marcado de estilo para superíndices y subíndices ... Sin embargo, cuando los superíndices y subíndices deben reflejar distinciones semánticas, es más fácil trabajar con estos significados codificados en texto. que el marcado, por ejemplo, en la transcripción fonética o fonémica .

Usos

El uso previsto cuando estos caracteres se agregaron a Unicode fue permitir que las fórmulas químicas y de álgebra y la fonética se escribieran sin marcas, pero produciendo verdaderos superíndices y subíndices. Por lo tanto, se supone que "H₂O" (usando un carácter de subíndice) es idéntico a "H 2 O" (con marcado de subíndice).

En realidad, la mayoría de las fuentes que incluyen estos caracteres ignoran la definición Unicode y diseñan los dígitos para los glifos de numerador y denominador matemático , que son más pequeños que los caracteres normales pero están alineados con la línea de límite y la línea de base , respectivamente. Cuando se usan con el solidus , estos glifos son útiles para hacer fracciones diagonales arbitrarias (similar al ½ glifo). Haciendo fracciones usando el software existente súper / subíndices requiere muchos caracteres y no se parece a la fracción rendido (ejemplo: 1 / 2 ), por lo que los diseñadores de fuentes proporciona esta alternativa. Esto también hace que las letras en superíndice sean útiles para los indicadores ordinales , ya que coinciden más estrechamente con los caracteres ª y º. Sin embargo, los hace incorrectos para superíndices y subíndices normales, y las fórmulas se representan correctamente utilizando marcas en lugar de estos caracteres.

Unicode tenía la intención de producir fracciones diagonales a través de un mecanismo diferente, pero tiene muy poca compatibilidad. La barra de fracción U + 2044 es visualmente similar al solidus, pero cuando se usa con los dígitos ordinarios (no los superíndices y subíndices) tiene la intención de indicarle a un sistema de diseño que una fracción como ¾ debe ser renderizada usando la sustitución automática de glifos para los dígitos. . Algunos navegadores admiten esto, pero no en todas las fuentes. En la siguiente tabla se muestra una selección de fuentes.

Comparación de codificaciones de fracciones simples
Caracteres Fuente Resultado
U + 00BD ½ FRACCIÓN VULGAR UNA MITAD Defecto ½
U + 00B9 ¹ SUPERSCRIPT UNO , U + 002F / SOLIDUS , U + 2082 SUBSCRIPT DOS ¹ / ₂
U + 00B9 ¹ SUPERSCRIPT ONE , U + 2044 FRACTION SLASH , U + 2082 SUSCRIPT DOS ¹⁄₂
U + 0031 1 DIGITO UNO ,
U + 2044 BARRA DE FRACCION ,
U + 0032 2 DIGITOS DOS
1⁄2
Arial 1⁄2
Cambría 1⁄2
Consolas 1⁄2
Times New Roman 1⁄2
FiraGO 1⁄2
EB Garamond 1⁄2
Cantarell 1⁄2
Lato 1⁄2
Linux Libertine O 1⁄2
Nimbus Roman 1⁄2
Ubuntu 1⁄2
Yrsa 1⁄2

Bloque de superíndices y subíndices

Los dígitos en superíndice más comunes (1, 2 y 3) estaban en ISO-8859-1 y, por lo tanto, se trasladaron a esas posiciones en el rango Latin-1 de Unicode. El resto se colocó en una sección dedicada de Unicode en U + 2070 a U + 209F. Las dos tablas siguientes muestran estos caracteres. Cada carácter de superíndice o subíndice está precedido por una x normal para mostrar el subíndice / superíndice. La tabla de la izquierda contiene los caracteres Unicode reales; el de la derecha contiene los equivalentes usando marcado HTML para el subíndice o superíndice.

Caracteres Unicode
0 1 2 3 4 5 6 7 8 9 A B C D mi F
U + 00Bx
U + 207x x⁰ xⁱ x⁴ x⁵ x⁶ x⁷ x⁸ x⁹ x⁺ x⁻ x⁼ X⁽ X⁾ xⁿ
U + 208x x₀ x₁ x₂ x₃ x₄ x₅ x₆ x₇ x₈ x₉ x₊ x₋ x₌ X₍ X₎
U + 209x xₐ xₑ xₒ xₓ xₔ xₕ xₖ xₗ xₘ xₙ xₚ xₛ xₜ
Simulado usando etiquetas <sup>o<sub>
0 1 2 3 4 5 6 7 8 9 A B C D mi F
U + 00Bx x 2 x 3 x 1
U + 207x x 0 x yo x 4 x 5 x 6 x 7 x 8 x 9 x + x - x = x ( x ) x n
U + 208x x 0 x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 x + x - x = x ( x )
U + 209x x a x e x o x x x ə x h x k x l x m x n x p x s x t
  Reservado para uso futuro.
  Otros caracteres de Latin-1 no relacionados con superguiones o subguiones.

Otros caracteres de superíndice y subíndice

La versión 13.0 de Unicode también incluye caracteres de subíndice y superíndice que están pensados ​​para uso semántico, en los siguientes bloques:

Sobrescrito
  • El bloque de Suplemento Latin-1 contiene los indicadores ordinales femeninos y masculinos ª y º.
  • El bloque Latin Extended-C contiene un superíndice adicional, ⱽ.
  • El bloque Latin Extended-D contiene cinco superíndices: ꝰ ꟸ ꟹ ꟲ ꟳ.
  • El bloque Latin Extended-E contiene cinco superíndices: ꭜ ꭝ ꭞ ꭟ ꭩ.
  • El bloque latín Extended-F está compuesto por superíndices.
  • El bloque de letras modificadoras de espaciado tiene letras y símbolos en superíndice que se utilizan para la transcripción fonética: ʰ ʱ ʲ ʳ ʴ ʵ ʶ ʷ ʸ ˀ ˁ ˠ ˡ ˢ ˣ ˤ.
  • El bloque Extensiones fonéticas tiene varias letras y símbolos en superíndice: Latín / IPA ᴬ ᴭ ᴮ ᴯ ᴰ ᴱ ᴲ ᴳ ᴴ ᴵ ᴶ ᴷ ᴸ ᴹ ᴺ ᴻ ᴼ ᴽ ᴾ ᴿ ᵀ ᵁ ᵂ ᵃ ᵄ ᵅ ᵆ ᵇ ᵈ ᵉ ᵊ ᵋ ᵌ ᵍ ᵏ ᵐ ᵑ ᵒ ᵓ ᵖ ᵗ ᵘ ᵚ ᵛ, griego ᵝ ᵞ ᵟ ᵠ, cirílico ᵸ, otro ᵎ ᵔ ᵕ ᵙ ᵜ. Estos están destinados a indicar una articulación secundaria .
  • El bloque Suplemento de extensiones fonéticas tiene varios más: Latín / IPA ᶛ ᶜ ᶝ ᶞ ᶟ ᶠ ᶡ ᶢ ᶣ ᶤ ᶥ ᶦ ᶧ ᶨ ᶩ ᶪ ᶫ ᶬ ᶭ ᶮ ᶯ ᶰ ᶱ ᶲ ᶳ ᶴ ᶵ ᶶ ᶷ ᶸ ᶹ ᶺ ᶻ ᶼ ᶽ ᶾ, griego ᶿ.
  • El bloque Cyrillic Extended-B contiene dos superíndices cirílicos : ꚜ ꚝ.
  • El bloque georgiano contiene una letra Mkhedruli con superíndice : ჼ.
  • El bloque Kanbun tiene caracteres de anotación en superíndice utilizados en copias japonesas de textos en chino clásico : ㆒ ㆓ ㆔ ㆕ ㆖ ㆗ ㆘ ㆙ ㆚ ㆛ ㆜ ㆝ ㆞ ㆟.
  • El bloque Tifinagh tiene una letra en superíndice: ⵯ.
  • Las sílabas aborígenes canadienses unificadas y sus bloques extendidos contienen varias letras, en su mayoría de consonantes, para indicar la coda de la sílaba llamada finales, junto con algunos caracteres que indican la sílaba media conocida como media: Bloque principal ᐜ ᐝ ᐞ ᐟ ᐠ ᐡ ᐢ ᐣ ᐤ ᐥ ᐦ ᐧ ᐨ ᐩ ᐪ ᑉ ᑊ ᑋ ᒃ ᒄ ᒡ ᒢ ᒻ ᒼ ᒽ ᒾ ᓐ ᓑ ᓒ ᓪ ᓫ ᔅ ᔆ ᔇ ᔈ ᔉ ᔊ ᔋ ᔥ ᔾ ᔿ ᕀ ᕁ ᕐ ᕑ ᕝ ᕪ ᕻ ᕯ ᕽ ᖅ ᖕ ᖖ ᖟ ᖦ ᖮ ᗮ ᘁ ᙆ ᙇ ᙚ ; Bloque extendido: ᣔ ᣕ ᣖ ᣗ ᣘ ᣙ ᣚ ᣛ ᣜ ᣝ ᣞ ᣟ ᣳ ᣴ ᣵ.
Combinando superíndice
  • El bloque Combinación de marcas diacríticas contiene diacríticos de letras medievales en superíndice. Estas letras están escritas directamente sobre otras letras que aparecen en manuscritos germánicos medievales, por lo que estos glifos no incluyen espacios, por ejemplo uͤ. Se muestran aquí sobre el marcador de posición del círculo punteado ◌: ◌ͣ ◌ͤ ◌ͥ ◌ͦ ◌ͧ ◌ͨ ◌ͩ ◌ͪ ◌ͫ ◌ͬ ◌ͭ ◌ͮ ◌ͯ.
  • El bloque Extendido de combinación de marcas diacríticas contiene dos letras combinadas para transcripciones lingüísticas de escocés : ◌ᪿ ◌ᫀ.
  • El bloque Suplemento de combinación de marcas diacríticas contiene diacríticos de letras en superíndice medievales adicionales, suficientes para completar el alfabeto latino básico en minúsculas, excepto j, qey, algunas mayúsculas y ligaduras pequeñas (ae, ao, av) y letras adicionales: ◌ᷓ ◌ ᷔ ◌ᷕ ◌ᷖ ◌ᷗ ◌ᷘ ◌ᷙ ◌ᷚ ◌ᷛ ◌ᷜ ◌ᷝ ◌ᷞ ◌ᷟ ◌ᷠ ◌ᷡ ◌ᷢ ◌ᷣ ◌ᷤ ◌ᷥ ◌ᷦ ◌ᷧ ◌ᷨ ◌ᷩ ◌ᷪ ◌ᷫ ◌ᷬ ◌ ᷭ ◌ᷮ ◌ᷯ ◌ᷰ ◌ᷱ ◌ᷲ ◌ᷳ ◌ᷴ.
  • Los bloques cirílico extendido-A y -B contienen múltiples diacríticos de letras en superíndice medievales, suficientes para completar el alfabeto cirílico en minúsculas básico utilizado en los textos eslavos eclesiásticos, también incluye una ligadura adicional (ст): ◌ⷠ ◌ⷡ ◌ⷢ ◌ⷣ ◌ⷤ ◌ ⷥ ◌ⷦ ◌ⷧ ◌ⷨ ◌ⷩ ◌ⷪ ◌ⷫ ◌ⷬ ◌ⷭ ◌ⷮ ◌ⷯ ◌ⷰ ◌ⷱ ◌ⷲ ◌ⷳ ◌ⷴ ◌ⷵ ◌ⷶ ◌ⷷ ◌ⷸ ◌ⷹ ◌ⷺ ◌ⷻ ◌ⷼ ◌ⷽ ◌ ⷾ ◌ⷿ ◌ꙴ ◌ꙵ ◌ꙶ ◌ꙷ ◌ꙸ ◌ꙹ ◌ꙺ ◌ꙻ ◌ꚞ ◌ꚟ.
Subíndice
  • El bloque Latin Extended-C contiene un subíndice adicional, ⱼ.
  • El bloque de extensiones fonéticas tiene varias letras y símbolos subindicados: latín / IPA ᵢ ᵣ ᵤ ᵥ y griego ᵦ ᵧ ᵨ ᵩ ᵪ.
Combinando subíndice

Tablas latinas, griegas y cirílicas

Consolidado, el estándar Unicode contiene versiones en superíndice y subíndice de un subconjunto de letras latinas, griegas y cirílicas. Aquí están ordenados alfabéticamente para compararlos (o para copiar y pegar cómodamente). Dado que estos caracteres aparecen en diferentes rangos Unicode, es posible que no parezcan tener el mismo tamaño o posición debido a la sustitución de fuentes en el navegador. Las celdas sombreadas marcan pequeñas mayúsculas que no son muy distintas de las minúsculas y letras griegas que no se pueden distinguir del latín, por lo que no se esperaría que fueran compatibles con Unicode.

Letras latinas en superíndice y subíndice
A B C D mi F GRAMO H I J K L METRO norte O PAG Q R S T U V W X Y Z
Capital de superíndice ᴿ
Casquillo pequeño superíndice 𐞄 𐞒 𐞖 𐞪 𐞲
Superíndice minúsculo ʰ ʲ ˡ 𐞥 ʳ ˢ ʷ ˣ ʸ
Gorra pequeña Overscript ◌ᷛ ◌ᷞ ◌ᷟ ◌ᷡ ◌ᷢ
Minúscula de superíndice ◌ͣ ◌ᷨ ◌ͨ ◌ͩ ◌ͤ ◌ᷫ ◌ᷚ ◌ͪ ◌ͥ ◌ᷜ ◌ᷝ ◌ͫ ◌ᷠ ◌ͦ ◌ᷮ ◌ͬ ◌ᷤ ◌ͭ ◌ͧ ◌ͮ ◌ᷱ ◌ͯ ◌ᷦ
Subíndice minúsculo
Guión minúsculo ◌᷊ ◌ᪿ
Letras griegas en superíndice y subíndice
Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω
Superíndice minúsculo ⁽ᵋ⁾ ᶿ ⁽ᶥ⁾ ⁽ᶹ⁾
Minúscula de superíndice ◌ᷩ
Subíndice minúsculo

Para IPA básico, consulte las letras de IPA en superíndice . Otros símbolos fonéticos son,

otras letras de superíndice y subíndice de IPA
ɑ æ C D ə ɩ ʃ ƫ ʍ ʔ
Sobrescrito 𐞃 ᶜ̧ ˀ
Sobrescrito ◌ᷧ ◌ᷔ ◌ᷗ ◌ᷙ ◌ᷪ ◌ᷯ ◌̉
Subíndice
Subrayado ◌ᫀ
Letras cirílicas en superíndice y subíndice
А Ә Е Є И І Ї О Ө У Ү Ѡ Ъ ЪІ Ы Ь Ѣ Э Ѥ Ю Ѫ Ѭ Ѧ
Sobrescrito * * * * * - * * * * * * * *
Sobrescrito ◌ⷶ ◌ⷷ ◌ꙴ ◌ꙵ ◌ꙶ ◌ⷪ ◌ꙷ ◌ⷹ ◌ꙻ ◌ꙸ ◌ꙹ ◌ꙺ ◌ⷺ ◌ⷼ ◌ꚟ ◌ⷻ ◌ⷾ ◌ⷿ ◌ⷽ
Subíndice * * * * - * * * *
Á В Г Ґ Д Ж З S К Л М Н П Р С Т Ф Х Ц Ч Џ Ш Щ Ѳ
Sobrescrito * * * * * * * * * * * * * * * * * *
Sobrescrito ◌ⷠ ◌ⷡ ◌ⷢ ◌ⷣ ◌ⷤ ◌ⷥ ◌ⷦ ◌ⷧ ◌ⷨ ◌ⷩ ◌ⷫ ◌ⷬ ◌ⷭ ◌ⷮ ◌ꚞ ◌ⷯ ◌ⷰ ◌ⷱ ◌ⷲ ◌ⷳ ◌ⷴ
Subíndice * * * * * * * * * * * * * * * * * *

* Caracteres aceptados para Unicode 15, que se publicarán en 2022.

Véase también versalitas en Unicode .

Caracteres compuestos

Principalmente por compatibilidad con conjuntos de caracteres anteriores, Unicode contiene varios caracteres que componen superíndices y subíndices con otros símbolos. En la mayoría de las fuentes, estos se renderizan mucho mejor que los intentos de construir estos símbolos a partir de los caracteres anteriores o mediante el marcado.

  • Las sílabas aborígenes canadienses unificadas y sus bloques extendidos contienen varias letras compuestas con superíndices para indicar valores de sonido extendidos: Bloque principal ᐂ ᐫ ᐬ ᐭ ᐮ ᐰ ᑍ ᑧ ᑨ ᑩ ᑪ ᑬ ᒅ ᒆ ᒇ ᒈ ᒊ ᒤ ᓁ ᓔ ᓮ ᔌ ᔍ ᔎ ᔏ ᔧ ᕅ ᕔ ᕿ ᖀ ᖁ ᖂ ᖃ ᖄ ᖎ ᖏ ᖐ ᖑ ᖒ ᖓ ᖔ ᙯ ᙰ ᙱ ᙲ ᙳ ᙴ ᙵ ᙶ, Bloque extendido ᢰ ᢱ ᢲ ᢳ ᢴ ᢵ ᢶ ᢷ ᢸ ᢹ ᢺ ᢻ ᢼ ᢽ ᢾ ᢿ ᣀ ᣁ ᣂ ᣃ ᣄ ᣅ.

Notas

Referencias