Kana de ancho medio - Half-width kana

Los kana de ancho medio (半角カ ナ, Hankaku kana ) son caracteres katakana que se muestran comprimidos a la mitad de su ancho normal (una relación de aspecto de 1: 2 ), en lugar de la relación de aspecto de cuadrado habitual (1: 1). Por ejemplo, la forma habitual (de ancho completo) del katakana ka es カ mientras que la forma de medio ancho es カ. De ancho medio hiragana no está incluido en Unicode, aunque es utilizable en la web o libros electrónicos a través de CSS Es font-feature-settings: "hwid" 1con Adobe-Japan1-6 fuentes OpenType basada. Los kanji de ancho medio no se pueden utilizar en las computadoras modernas a pesar de que se usan en algunas impresoras de recibos, tablones de anuncios eléctricos o computadoras viejas.

Los kana de ancho medio se utilizaron en los primeros días de la informática japonesa, para permitir que los caracteres japoneses se mostraran en la misma cuadrícula que las fuentes monoespaciadas de los caracteres latinos. No se utilizaron kanji de ancho medio. Los caracteres kana de ancho medio no se usan generalmente en la actualidad, pero encuentran algún uso en entornos específicos, como pantallas de cajas registradoras , recibos de tiendas, televisión digital japonesa y subtítulos de DVD y etiquetas de direcciones postales. A veces, su uso también es una elección estilística, particularmente frecuente en ciertas jergas de Internet .

El término "kana de ancho medio", que se refiere estrictamente solo a cómo se muestran los kana , no a cómo se almacenan , también se usa de manera vaga para referirse al bloque A0 – DF (hexadecimal) donde los katakana se almacenan en algunas codificaciones de caracteres , como como JIS X 0201 (1969); consulte las codificaciones a continuación. Sin embargo, esto es formalmente incorrecto: este estándar JIS simplemente especifica que katakana se puede almacenar en estas ubicaciones, sin especificar cómo deben mostrarse; la confusión se debe a que en la informática inicial, los caracteres almacenados aquí se mostraban de hecho como kana de ancho medio; consulte la confusión a continuación.

Historia

Esta pantalla LED en la estación Haiki muestra シ ー サ イ ド ​​ラ イ ナ ー ( Seaside Liner ) en katakana de ancho medio. Sin embargo, el dakuten no parece ser tratado como un personaje separado.

El kana de medio ancho y el kana de 2/3 de ancho se utilizaron desde la era anterior a las computadoras. En la era de las computadoras, ASCII se define como un conjunto de caracteres de 7 bits y tiene espacio para 128 caracteres. Sin embargo, dado que este estándar fue diseñado para los Estados Unidos , no contiene caracteres y símbolos, como el símbolo del yen (¥) necesario para representar la moneda japonesa, ni incluía espacio para caracteres de otros alfabetos, como kana o kanji. - por lo tanto, los caracteres japoneses no se pueden codificar . Además, los caracteres japoneses, tanto kana como kanji, se dibujan en una cuadrícula cuadrada, mientras que los caracteres latinos generalmente se escriben de forma más estrecha, por lo que tampoco se pueden mostrar los caracteres japoneses .

JIS X 0201 se desarrolló en 1969, una época en la que las computadoras eran generalmente incapaces, tanto por el diseño de software como por los recursos de hardware, de representar los miles de caracteres kanji de origen chino utilizados en japonés. Como compromiso, este katakana codificado estándar (solo, no hiragana o kanji) como un pequeño conjunto de caracteres, asignados en el rango de valor de byte superior de 0x80–0xFF. Esto permitió a los procesadores de 8 bits codificar y procesar el texto japonés fonéticamente (como katakana), aunque sin poder procesar hiragana o kanji. Estos caracteres katakana se mostraban a su vez como "kana de ancho medio", un factor de forma nuevo, poco ortodoxo y más estrecho para ajustarse al mismo ancho que las máquinas de alfabetos latinos monoespaciados eran capaces de imprimir y mostrar. En cuanto a la codificación, JIS X 0201 es una extensión variante de ASCII: incluye caracteres adicionales y no coincide exactamente con ASCII en la parte superpuesta (la sección de caracteres latinos).

Mensajes de transacción escritos en kana de ancho medio en un libro de banco

Los kana de ancho medio se desarrollaron como "... los primeros caracteres japoneses codificados en computadoras porque se utilizan para telegramas japoneses".

El Sistema Nacional de Comunicación de Datos Bancarios (全国 銀行 デ ー タ 通信 シ ス テ ム) , el sistema de transferencia de fondos más grande de Japón, se estableció en 1973. Los mensajes de transacciones entre bancos solo podían usar caracteres latinos, números y katakana de ancho medio dentro de los 20 caracteres. El sistema es reemplazado por ZEDI (Sistema de intercambio electrónico de datos bancarios a nivel nacional) en 2018, que puede manejar hiragana y kanji con caracteres de longitud variable.

Para hacer que katakana encajara en el área de celda más estrecha permitida, se hicieron algunos compromisos. Por ejemplo, los signos diacríticos dakuten y handakuten se tratan como caracteres separados en lugar de formar parte del carácter anterior. Este compromiso llevó a muchos a considerar "kana de ancho medio" visualmente poco atractivo y causa problemas para muchos programas de computadora en la actualidad.

Recibo con kana de ancho medio para ahorrar espacio

Otro uso del kana de ancho medio es ahorrar espacio. La versión japonesa de Windows 95 usaba katakana de ancho medio de MS P Gothic en su interfaz de usuario. Fue reemplazado por kana de ancho completo de MS UI Gothic, un poco más estrecho que MS P Gothic.

Codificación

En la especificación JIS X 0201 (1969), los katakana están codificados en el bloque A0 – DF (hexadecimal); no se especifica cómo se muestran y no hay codificación separada de kana de ancho completo y medio. En JIS X 0208 , katakana, hiragana y kanji están todos codificados (y se muestran como caracteres de ancho completo; no hay caracteres de ancho medio), aunque el orden de los kana es diferente; consulte JIS X 0208 # Hiragana y katakana .

En Shift JIS , que combina JIS X 0201 y JIS X 0208, estas codificaciones (las cuales pueden codificar caracteres latinos y katakana) se almacenan por separado, y JIS X 0201 se muestra como de ancho medio (por lo tanto, los katakana de JIS X 0201 son se muestran como kana de ancho medio), mientras que JIS X 0208 se muestran todos como de ancho completo (por lo tanto, los caracteres latinos JIS X 0208 se muestran todos como caracteres latinos de ancho completo). Por lo tanto, en Shift JIS, los caracteres latinos y katakana tienen dos codificaciones con dos formas de visualización separadas, tanto de ancho medio como de ancho completo.

En Unicode , katakana e hiragana se utilizan principalmente como caracteres normales de ancho completo (los bloques Katakana e Hiragana se muestran como caracteres de ancho completo); un bloque separado, el bloque Formularios de ancho medio y ancho completo se utiliza para almacenar caracteres variantes, incluidos kana de ancho medio y caracteres latinos de ancho completo.

Por lo tanto, el katakana en JIS X 0201 y la parte correspondiente de las codificaciones derivadas (la parte JIS X 0201 de Shift JIS) se muestran como de ancho medio, mientras que en Unicode las formas de ancho medio se especifican por separado.

Mesa de medio ancho

"J" indica los primeros cuatro bits en JIS X 0201 (aunque consulte a continuación , estos no necesariamente indican la mitad de ancho) y en otros conjuntos como Shift JIS , "U" indica la fila en Unicode en el bloque de formularios de ancho medio y ancho completo .

J U 0 1 2 3 4 5 6 7 8 9 A B C D mi F
A FF6  
B FF7 ソ
C FF8
D FF9

Tenga en cuenta que la primera celda en blanco representa un carácter inexistente en JIS, A0; pero un doble paréntesis de ancho completo ⦆ en Unicode, U + FF60.

Kana de ancho medio en Internet

Correo electrónico

Dado que los protocolos SMTP y NNTP (utilizados para enviar correo electrónico y Usenet , respectivamente) anteriormente solo podían transmitir 7 bits, la convención era utilizar ISO-2022-JP para enviar correo electrónico en japonés.

ISO-2022-JP no contiene kana de ancho medio: incluye el conjunto romano de JIS X 0201 y todo JIS X 0208, pero no el conjunto de katakana de JIS X 0201 (que se utiliza para kana de ancho medio en Shift JIS, por ejemplo). Ambos conjuntos de JIS X 0201 tienen códigos ISO 2022, pero el perfil ISO-2022-JP solo incluye el conjunto Roman: esto significa que el formato para incluir katakana de ancho medio en ISO-2022-JP está bien definido y constituye una violación del formato ISO-2022-JP. Por esta razón, si un kana de ancho medio se incluye accidentalmente en un mensaje, podría distorsionarse durante la transmisión (ver mojibake ). El estándar de codificación WHATWG utilizado por HTML5 permite la decodificación, pero no la codificación, de katakana JIS X 0201 en ISO-2022-JP como una extensión del formato, y convierte katakana de ancho medio a sus equivalentes JIS X 0208 al codificar.

Esto ya no es un problema, ya que la mayoría de los servidores de correo electrónico actuales admiten la extensión 8BITMIME y, por lo tanto, comprenden los caracteres de 8 bits. Alternativamente, un sistema de codificación como Base64 se puede usar y especificar en el mensaje usando MIME .

páginas web

El problema que existe en el correo electrónico no existe con las páginas web ya que HTTP acepta caracteres de 8 bits.

Sin embargo, un problema que existe es que los programas de computadora tienen dificultades para determinar si tratar un carácter como Shift JIS , EUC-JP o UTF-8 ; por lo tanto, la información del código de caracteres debe especificarse con un encabezado de respuesta HTTP o una etiqueta Meta .

Confusión

Estrictamente hablando, la codificación JIS X 0201 como "katakana de ancho medio" es incorrecta, ya que el estándar no define el ancho de los caracteres; solo define la representación del código de los caracteres katakana. En el estándar JIS X 0201, los caracteres katakana se imprimen en ancho normal (completo), no en medio ancho.

Los caracteres de ancho medio solo se usaron para mostrar durante el período en el que los caracteres se mostraban en el ancho medio (y se usaron codificaciones de un solo byte), antes de que se mostraran los caracteres de ancho completo (y las codificaciones de doble byte asociadas como JIS X 0208). generalizado. Sin embargo, en el estándar Shift JIS, que combina el estándar JIS X 0201 (cuyos caracteres - latin y katakana - se mostraban como de ancho medio) y el estándar JIS X 0208 (cuyos caracteres - katakana, hiragana, kanji y latin - eran se muestran como de ancho completo), los caracteres katakana y latinos se codifican dos veces, tanto en JIS X 0201 como en JIS 0208, pero se muestran como de ancho medio o de ancho completo según la sección en la que se encuentren (0201 o 0208); por lo tanto, el 0201 Se puede pensar que el bloque katakana corresponde a "kana de ancho medio", y el malentendido de que el estándar 0201 define caracteres de "ancho medio" está muy extendido.

Además, aunque JIS X 0201 es una codificación de un solo byte (y se muestra en medio ancho) y JIS X 0208 es una codificación de doble byte (y se muestra en ancho completo), no hay conexión entre el número de bytes y el ancho ( distintos de los correspondientes en Shift JIS, como arriba) - por ejemplo, Unicode se puede codificar con cuatro bytes ( UTF-32 ) para mostrar tanto caracteres de ancho completo como de ancho simple.

En la cultura popular

Los personajes kana de ancho medio aparecen al público en la trilogía Matrix , dirigida por los Wachowski . La 'lluvia digital' consta de caracteres kana de ancho medio reflejados, letras latinas y números arábigos.

Ver también

Referencias

  • ^ Lunde, Ken. Procesamiento de información CJKV. O'Reilly, 2ª ed., 2009,pág. 224–226(también 1ª ed., 1999. p. 144–145)