Guión suave - Soft hyphen

Símbolo ISO para guión suave

En informática y composición tipográfica, un guión suave (ISO 8859: 0xAD, Unicode U + 00AD SOFT HYPHEN , HTML: & # xAD; o & # 173; o & shy;) o un guión de sílaba (EBCDIC: 0xCA), abreviado SHY , es un punto de código reservado en algunos juegos de caracteres codificados con el propósito de dividir palabras entre líneas insertando guiones visibles . Han surgido dos formas alternativas de utilizar el carácter de guión suave para este propósito, dependiendo de si el texto codificado será dividido en líneas por su destinatario o ya ha sido preformateado por su creador.

Texto a ser formateado por el destinatario

El uso de caracteres SHY en el texto que el destinatario dividirá en líneas es el contexto de la aplicación considerado por las especificaciones HTML y Unicode posteriores a 1999 , así como algunos formatos de archivo de procesamiento de texto. En este contexto, el guión suave también puede denominarse guión discrecional o guión opcional . Sirve como un marcador invisible que se utiliza para especificar un lugar en el texto donde se permite un salto con guión sin forzar un salto de línea en un lugar inconveniente si el texto vuelve a fluir. Se vuelve visible solo después del ajuste de palabras al final de una línea. La semántica Unicode del guión suave y la implementación HTML son en muchos aspectos similares al espacio de ancho cero de Unicode , con la excepción de que el guión suave preservará el kerning de los caracteres en ambos lados cuando no estén visibles. El espacio de ancho cero, por otro lado, no lo hará, ya que se considera un carácter visible incluso si no se representa, por lo que tiene sus propias métricas de kerning.

Para mostrar el efecto de un guión suave en HTML, las palabras del siguiente texto se han separado con guiones suaves:

MargaretAreYouGrievingOverGoldengroveUnleavingLeavesLikeTheThingsOfManYouWithYourFreshThoughtsCareForCanYouAhAsTheHeartGrowsOlderItWillComeToSuchSightsColderByAndByNorSpareASighThoughWorldsOfWanwoodLeafmealLieAndYetYouWillWeepAndKnowWhyNowNoMatterChildTheNameSorrowsSpringsAreTheSameNorMouthHadNoNorMindExpressedWhatHeartHeardOfGhostGuessedItIsTheBlightManWasBornForItIsMargaretYouMournFor

En los navegadores HTML que admiten guiones suaves, cambiar el tamaño de la ventana volverá a dividir el texto anterior solo en los límites de las palabras e insertará un guión al final de cada línea.

Texto preformateado por el creador

El carácter SHY también se usa en texto donde los párrafos ya se han dividido en líneas, como ciertos archivos de texto sin formato, texto enviado a emuladores o impresoras de terminal de estilo VT100 , o páginas representadas en lenguajes de descripción de página . Este es el contexto de aplicación originalmente considerado por los estándares EBCDIC e ISO 8859-1 e implementado en muchos emuladores de terminal VT100 .

Aquí, SHY es un guión visible que, por lo general, no se puede distinguir visualmente de un guión normal, pero se ha insertado únicamente con el propósito de romper líneas. El propósito del guión suave aquí es distinguirlo de cualquier guión regular que podría haber sido parte de la ortografía original de la palabra. Esta distinción ayuda a reutilizar el texto ya formateado, cuando los saltos de línea y los guiones suaves insertados durante el ajuste de palabras deben eliminarse para convertir el texto de nuevo a su forma sin formato. Por ejemplo, la función de copiar o pegar de un emulador de terminal puede ofrecer reemplazar los saltos de línea con un carácter de espacio y eliminar los guiones suaves, incluidos los espacios en blanco que siguen inmediatamente .

Una aplicación de ejemplo que genera guiones suaves por esta razón es el formateador de texto groff que se usa en muchos sistemas Unix / Linux para mostrar páginas de manual .

Codificaciones y definiciones

Caracteres TÍMIDOS en conjuntos de caracteres codificados, aproximadamente en orden cronológico:

  • EBCDIC colocó un carácter SHY (conocido allí como un "guión de sílaba") en la posición 202 (0xCA hexadecimal ). IBM definió su propósito como un "guión utilizado para dividir una palabra al final de una línea [que] puede eliminarse cuando un programa ajusta líneas".
  • La norma alemana DIN 31626 definió un conjunto de códigos de control C1 que definen 0x8D como un "Control de sílabas opcional (OSC)", un "carácter de control de impresión" para marcar límites de sílabas en palabras largas. Este conjunto de control C1 se registró en 1979. (Nota: no es lo mismo que el código de control ISO / IEC 6429 C1 Operating System Command (OSC)) .
  • ISO 8859-1 : 1986 (latín 1) heredó SHY de EBCDIC, pero lo llamó "guión suave", lo colocó en la posición 0xAD (hexadecimal) y declaró su propósito como "para usar cuando se ha establecido un salto de línea dentro de una palabra ". Otras partes de ISO 8859 lo colocaron en la misma posición, con la excepción de ISO 8859-11 (latino / tailandés), que carece de él.
  • La página de códigos de IBM 850 (un juego de caracteres de MS-DOS que cubre todos los caracteres ISO 8859-1) lo colocó en la posición 240 = 0xF0.
  • El conjunto de entidades de caracteres "numérico y gráfico especial" (isonum) de SGML (ISO 8879: 1986) incluye "& shy;" para el guión suave ISO 8859-1.
  • Unicode 1.0 (1991) e ISO 10646 (1993) tomaron las primeras 256 posiciones de código de ISO 8859-1, lo que resultó en SHY en el punto de código Unicode de U + 00AD.
  • HTML 2 (1995) incorporó el "& shy;" entidad de carácter de SGML, pero desaconsejó explícitamente su uso.
  • HTML 4 (1999) redefinió el propósito del carácter como marcar una oportunidad de separación de sílabas, que solo se vuelve visible como un guión al final de una línea después del formateo.
  • Unicode 4.0 (2002) cambió la categoría de su carácter SHY de anteriormente "Pd" (puntuación, guión) a "Cf" (otro, formato), alineando así su interpretación del carácter con la de HTML 4.

Otros comandos para marcar oportunidades de separación de sílabas en lenguajes de formato de texto (similar a la interpretación HTML 4 y Unicode 4.0 de SHY):

Temas de seguridad

Se han utilizado guiones suaves para ocultar dominios o URL maliciosos en el correo no deseado .

Ver también

Referencias