Texto formateado - Formatted text

El texto con formato , el texto con estilo o el texto enriquecido , a diferencia del texto sin formato , tiene información de estilo más allá del mínimo de elementos semánticos: colores, estilos (negrita, cursiva), tamaños y características especiales en HTML (como hipervínculos ).

Terminología

El texto formateado no puede identificarse correctamente con archivos binarios ni diferenciarse del texto ASCII. Esto se debe a que el texto formateado no es necesariamente binario, puede ser solo texto, como HTML , RTF o archivos de texto enriquecido , y puede ser solo ASCII. Por el contrario, un archivo de texto sin formato puede no ser ASCII (en una codificación como Unicode UTF-8 ). El texto formateado de solo texto se logra mediante el marcado, que también es textual, mientras que algunos editores de texto formateado como Microsoft Word guardan en formato binario.

Comienzos del texto formateado

El texto formateado tiene su origen en el uso previo a la computadora del subrayado para envalentonar pasajes en manuscritos mecanografiados . En los primeros sistemas interactivos de la tecnología informática temprana, el subrayado no era posible y los usuarios compensaban esta falta (y la falta de formato en ASCII) utilizando ciertos símbolos como sustitutos. El énfasis, por ejemplo, podría lograrse en ASCII de varias maneras:

  • Capitalización: NO me lo estoy inventando.
  • Rodeado de guiones bajos: _no_ estoy inventando esto.
  • Rodeado de asteriscos: * no * me lo estoy inventando.
  • Espaciado: no me lo estoy inventando.

El entorno con guiones bajos también se utilizó para los títulos de los libros: búsquelo en _The_C_Programming_Language_.

Lenguajes de marcado

El formato se puede marcar mediante etiquetas que se distinguen del texto del cuerpo mediante caracteres especiales, como los corchetes angulares en HTML . Por ejemplo, este texto:

El perro está clasificado como Canis lupus familiaris en taxonomía.

está marcado en HTML así:

<p>The dog is classified as <i>Canis lupus familiaris</i> in taxonomy.</p>

El texto en cursiva está delimitado por una etiqueta de cursiva de apertura y de cierre. En LaTeX , el texto se marcaría así:

The dog is classified as \textit{Canis lupus familiaris} in taxonomy.

La mayoría de los lenguajes de marcado se pueden editar con cualquier editor de texto , sin necesidad de software especial . Muchos lenguajes de marcado también se pueden editar con software especializado diseñado para automatizar algunas funciones o presentar la salida como WYSIWYG .

Archivos de documentos formateados

Desde la invención de MacWrite , el primer procesador de texto WYSIWYG , en el que el mecanógrafo codifica el formato visualmente en lugar de insertar marcas textuales, los procesadores de texto han tendido a guardar en archivos binarios . Al abrir dichos archivos con un editor de texto, aparecen incrustados con varios caracteres binarios, ya sea alrededor del texto formateado (por ejemplo, en WordPerfect ) o separados de él, al principio o al final del archivo (por ejemplo, en Microsoft Word ).

Los documentos de texto formateados en archivos binarios tienen, sin embargo, las desventajas del alcance del formato y el secreto. Mientras que la extensión del formateo se marca con precisión en los lenguajes de marcado, el formateo WYSIWYG se basa en la memoria, es decir, manteniendo, por ejemplo, presionando el botón en negrita hasta que se cancele. Esto puede provocar errores de formato y problemas de mantenimiento. En cuanto al secreto, los formatos de archivo de documentos de texto formateados tienden a ser propietarios e indocumentados, lo que genera dificultades en la compatibilidad de codificación por parte de terceros y también actualizaciones innecesarias debido a cambios de versión.

WordStar era un procesador de texto popular que no usaba archivos binarios con caracteres ocultos.

OpenOffice.org Writer guarda archivos en formato XML . Sin embargo, el archivo resultante es un binario ya que está comprimido ( equivalente a un tarball ).

PDF es otro formato de archivo de texto formateado que generalmente es binario (usa compresión para el texto y almacena gráficos y fuentes en binario). Por lo general, es un formato de usuario final, escrito desde una aplicación como Microsoft Word u OpenOffice.org Writer, y el usuario no puede editarlo una vez hecho.

Ver también

Referencias

enlaces externos

Notas

  1. Cottrell, Allin (29 de junio de 1999). "Procesadores de texto: estúpidos e ineficientes" . ricardo.ecn.wfu.edu . Archivado desde el original el 4 de mayo de 2021 . Consultado el 12 de mayo de 2021 .