ISO / IEC 646 - ISO/IEC 646

Familia de codificación ISO 646
ISO-646-infobox.svg
Invariante ISO 646. Los nudos Bowen rojos (⌘) denotan puntos de código nacional. Otros caracteres rojos se cambian con modificaciones menores dignas de mención.
Estándar ISO / IEC 646, ITU T.50
Clasificación Codificación latina básica de 7 bits
Precedido por US-ASCII
Sucesor ISO 8859 , ISO 10646
Otras codificaciones relacionadas DEC NRCS , Adaptaciones de teletexto del sistema mundial
a otros alfabetos :
ELOT 927 , Símbolo , KOI-7 , SRPSCII y MAKSCII , ASMO 449 , SI 960

ISO / IEC 646 es el nombre de un conjunto de normas ISO , descritas como Tecnología de la información: conjunto de caracteres codificados ISO de 7 bits para el intercambio de información y desarrollado en cooperación con ASCII al menos desde 1964. Desde su primera edición en 1967 ha especificado un Código de caracteres de 7 bits del que se derivan varios estándares nacionales.

ISO / IEC 646 también fue ratificado por ECMA como ECMA-6 . La primera versión del ECMA-6 se publicó en 1965, basándose en el trabajo que el Comité Técnico TC1 del ECMA había realizado desde diciembre de 1960.

Los caracteres del conjunto básico de caracteres ISO / IEC 646 son caracteres invariables . Dado que esa parte de ISO / IEC 646, que es el conjunto de caracteres invariantes compartido por todos los países, especificó solo las letras utilizadas en el alfabeto latino básico de ISO , los países que usaban letras adicionales necesitaban crear variantes nacionales de ISO 646 para poder utilizar sus escrituras nativas. Dado que la transmisión y el almacenamiento de códigos de 8 bits no eran estándar en ese momento, los caracteres nacionales tuvieron que ajustarse a las restricciones de 7 bits, lo que significa que algunos caracteres que aparecen en ASCII no aparecen en otras variantes nacionales de ISO 646. .

Historia

ASCII temprano ( ASA X3.4 : 1963)

ISO / IEC 646 y su predecesor ASCII ( ASA X3.4 ) respaldaron en gran medida la práctica existente con respecto a las codificaciones de caracteres en la industria de las telecomunicaciones .

US-ASCII o ISO 646: EE. UU.

Como ASCII no proporcionó una cantidad de caracteres necesarios para idiomas distintos del inglés, se hicieron varias variantes nacionales que sustituyeron algunos caracteres menos utilizados por otros necesarios. Debido a la incompatibilidad de las diversas variantes nacionales, se introdujo una Versión de referencia internacional (IRV) de ISO / IEC 646, en un intento de al menos restringir el conjunto reemplazado a los mismos caracteres en todas las variantes. La versión original (ISO 646 IRV) difería de ASCII solo en que el punto de código 0x24, el signo de dólar de ASCII ($) fue reemplazado por el símbolo de moneda internacional (¤). La versión final de 1991 del código ISO 646: 1991 también se conoce como ITU T.50 , Alfabeto de referencia internacional o IRA, anteriormente Alfabeto internacional No. 5 (IA5). Este estándar permite a los usuarios ejercitar los 12 caracteres variables (es decir, dos caracteres gráficos alternativos y 10 caracteres definidos a nivel nacional). Entre estos ejercicios, ISO 646: 1991 IRV (Versión de referencia internacional) se define explícitamente y es idéntico a ASCII .

La serie de normas ISO 8859 que gobiernan las codificaciones de caracteres de 8 bits reemplaza la norma internacional ISO 646 y sus variantes nacionales, proporcionando 96 caracteres adicionales con el bit adicional y evitando así cualquier sustitución de códigos ASCII. El estándar ISO 10646 , directamente relacionado con Unicode , reemplaza todos los conjuntos ISO 646 e ISO 8859 con un conjunto unificado de codificaciones de caracteres utilizando un valor mayor de 21 bits.

ISO 646: JP

Un legado de ISO / IEC 646 es visible en Windows, donde en muchas configuraciones regionales de Asia Oriental, el carácter de barra invertida utilizado en los nombres de archivo se representa como ¥ u otros caracteres como . A pesar de que un código diferente para ¥ estaba disponible incluso en la página de códigos 437 de la IBM PC original , y un código de doble byte separado para ¥ está disponible en Shift JIS (aunque esto a menudo usa mapeo alternativo ), mucho texto se creó con el código de barra invertida utilizado para ¥ (debido a que Shift_JIS se basa oficialmente en ISO 646: JP, aunque Microsoft lo asigna como ASCII) que incluso las fuentes modernas de Windows han considerado necesario representar el código de esa manera. Existe una situación similar con ₩ y EUC-KR . Otro legado es la existencia de trigrafos en el lenguaje de programación C .

Estándares publicados

  • ISO / R646-1967
  • ISO 646: 1972
  • ISO 646: 1983
  • ISO / IEC 646: 1991
  • ECMA-6 (30 de abril de 1965), primera edición
  • ECMA-6 (1967-06), segunda edición
  • ECMA-6 (1970-07), tercera edición
  • ECMA-6 (1973-08), cuarta edición
  • ECMA-6 (1984-12, 1985-03), quinta edición
  • ECMA-6 (1991-12, 1997-08), sexta edición

Diseño de página de códigos

La siguiente tabla muestra el conjunto de caracteres invariantes ISO / IEC 646. Cada carácter se muestra con el código hexadecimal de su equivalente Unicode . Los puntos de código nacional son grises con el carácter ASCII que se reemplaza. Un cuadro pesado indica un carácter que, en algunas regiones, podría combinarse con un carácter anterior como diacrítico utilizando el carácter de retroceso , lo que puede afectar la elección del glifo .

Además de las restricciones de conjuntos invariantes, 0x23 está restringido para ser # o £ y 0x24 está restringido para ser $ o ¤ en ECMA-6: 1991, equivalente a ISO 646: 1991. Sin embargo, estas restricciones no son seguidas por todas las variantes nacionales.

ISO / IEC 646 (-INV)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _MI _F
0_
0
NUL
0000
SOH
0001
STX
0002
ETX
0003
EOT
0004
ENQ
0005
ACK
0006
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
SO
000E
SI
000F
1_
16
DLE
0010
DC1
0011
DC2
0012
DC3
0013
DC4
0014
NAK
0015
SYN
0016
ETB
0017
PUEDE
0018
EM
0019
SUB
001A
ESC
001B
FS
001C
GS
001D
RS
001E
US
001F
2_
32
SP
0020
!
0021
"
0022
#
 
PS
 
%
0025
&
0026
«
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
 
A
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
Yo
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
5_
80
P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
 
\
 
]
 
^
 
_
005F
6_
96
'
 
un
0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
h
0068
yo
0069
j
006A
k
006B
l
006C
m
006D
n
006E
o
006F
7_
112
p
0070
q
0071
r
0072
s
0073
t
0074
u
0075
v
0076
w
0077
x
0078
y
0079
z
007A
{
 
|
 
}
 
~
 
DEL
007F

  Carta  Número  Puntuación  Símbolo  Otro  Indefinido

Familias de codificación relacionadas

Juego de caracteres de reemplazo nacional

El juego de caracteres de reemplazo nacional ( NRCS ) es una familia de codificaciones de 7 bits introducida en 1983 por DEC con la serie VT200 de terminales de computadora. Está estrechamente relacionado con ISO 646, ya que se basa en un subconjunto invariante similar de ASCII, que se diferencia en retener $como invariante pero no _(aunque la mayoría de las variantes de NRCS retienen el _conjunto invariante de ISO 646 y, por lo tanto, cumplen con él). La mayoría de las variantes de NRCS están estrechamente relacionadas con las correspondientes variantes nacionales de ISO 646 cuando existan, con la excepción de la variante holandesa .

Teletexto del sistema mundial

El estándar europeo de telecomunicaciones ETS 300 706, "Especificación de teletexto mejorado", define conjuntos de códigos latinos, griegos, cirílicos, árabes y hebreos con varias variantes nacionales tanto para el latín como para el cirílico. Al igual que NRCS e ISO 646, dentro de las variantes latinas, la familia de codificaciones conocida como el conjunto G0 se basa en un subconjunto invariante similar de ASCII, pero no retiene $ni _como invariante. A diferencia de NRCS, las variantes a menudo difieren considerablemente de las variantes nacionales correspondientes de ISO 646.

Descripciones y códigos de variantes

Variantes nacionales ISO 646

Algunas variantes nacionales de ISO 646 son las siguientes:

Código ISO-IR ISO ESC Aprobado Norma nacional Descripción
California 121 ESC 2/8 7/7 ISO 646 CSA Z243.4-1985-1 Canadá (alternativa n. ° 1, con "î")
( francés , clásico) ( página de códigos 1020 )
CA2 122 ESC 2/8 7/8 ISO 646 CSA Z243.4-1985-2 Canadá (alternativa nº 2, con "É")
( francés , ortografía reformada)
CN 57 ESC 2/8 5/4 ? GB / T 1988-80 República Popular de China (latín básico)
CU 151 ESC 2/8 2/1 4/1 ISO 646 NC 99-10: 81 / NC NC00-10: 81 Cuba ( español )
DANO 9-1 ESC 2/8 4/5 SIS ? NATS-DANO Noruega y Dinamarca (textos periodísticos). El punto de código invariante 0x22 se muestra como «, (comparar "en el IRV). Sin embargo, todavía se considera una comilla doble. Acompaña a SEFI (NATS-SEFI).
Delaware 21 ESC 2/8 4/11 ISO 646 DIN 66003 Alemania ( alemán ) ( página de códigos 1011 , 20106 )
DK - ? DS 2089 Dinamarca ( danés ) ( Página de códigos 1017 )
ES 17 ESC 2/8 5/10 ECMA Olivetti Español (internacional) ( Código página 1023 )
ES2 85 ESC 2/8 6/8 ECMA IBM España ( vasco , castellano , catalán , gallego ) ( página de código 1014 )
FI 10 ISO 646 SFS 4017 Finlandia (versión básica) ( Página de códigos 1018 )
FR 69 ESC 2/8 6/6 ISO 646 AFNOR NF Z 62010-1982 Francia ( francés ) ( página de códigos 1010 )
FR1 25 ESC 2/8 5/2 ISO 646 AFNOR NF Z 62010-1973 Francia (obsoleto desde abril de 1985) ( Código página 1104 )
GB 4 ESC 2/8 4/1 ISO 646 BS 4730 Reino Unido ( inglés ) ( página de códigos 1013 )
HU 86 ESC 2/8 6/9 ISO 646 MSZ 7795/3 Hungría ( húngaro )
ES DECIR 207 ? NSAI 433: 1996 Irlanda ( irlandés )
INV 170 ESC 2/8 2/1 4/2 ISO 646 ISO 646: 1983 Subconjunto invariante
(IRV) 2 ESC 2/8 4/0 ISO 646 ISO 646: 1973 Versión de referencia internacional. 0x7E como una línea superior (ISO-IR-002).
? ? ISO 646 ISO 646: 1983 Versión de referencia internacional. 0x7E como tilde ( página de códigos 1009 , 20105 ).
La versión de referencia internacional ISO 646: 1991 coincide con la variante de EE. UU. (Ver más abajo).
ES ? ? ? Islandia ( islandés )
ESO 15 ESC 2/8 5/9 ECMA UNI 0204-70 / Olivetti ? Italiano ( página de códigos 1012 )
JP 14 ESC 2/8 4/10 ISO 646 JIS C 6220: 1969-ro Japón ( Romaji ) ( página de códigos 895 ). También se utiliza como código de 8 bits con el correspondiente conjunto complementario Katakana .
JP-OCR-B 92 ESC 2/8 6/14 ISO 646 JIS C 6229-1984-b Japón ( OCR -B)
KR - ? KS C 5636-1989 Corea del Sur
MONTE - ? ? Malta ( maltés , inglés )
NL - ECMA IBM Países Bajos ( holandés ) ( página de códigos 1019 )
NO 60 ESC 2/8 6/0 ISO 646 NS 4551 versión 1 Noruega ( página de códigos 1016 )
NO2 61 ESC 2/8 6/1 ISO 646 NS 4551 versión 2 Noruega (obsoleto desde junio de 1987) ( Página de código 20108 )
pl - BN-74 / 3101-01 Polonia (el polaco tiene 18 letras con signos diacríticos, pero solo 9 letras minúsculas están normalizadas debido a razones de espacio de código.
PT dieciséis ESC 2/8 4/12 ECMA Olivetti Portugués (internacional)
PT2 84 ESC 2/8 6/7 ECMA IBM Portugal ( portugués , español ) ( página de códigos 1015
SE 10 ESC 2/8 4/7 ISO 646 SEN 850200 Anexo B, SIS 63 61 27 Suecia ( sueco básico ) ( página de códigos 1018 , D47)
SE2 11 ESC 2/8 4/8 ISO 646 SEN 850200 Anexo C, SIS 63 61 27 Suecia ( sueco extendido para nombres) ( página de códigos 20107 , E47)
SEFI 8-1 ESC 2/8 4/3 SIS NATS-SEFI Suecia y Finlandia (textos periodísticos). Acompaña a DANO (NATS-DANO).
T.61-7bit 102 ESC 2/8 7/5 ? UIT / CCITT T.61 Recomendación Internacional ( Teletex ). También se utiliza con el conjunto suplementario correspondiente como código de 8 bits.
TW - ? CNS 5205-1996 República de China ( Taiwán )
EE. UU. / (IRV) 6 ESC 2/8 4/2 ISO 646 ANSI X3.4-1968 e ISO 646: 1983 (también IRV en ISO / IEC 646: 1991) Estados Unidos ( ASCII , página de códigos 367 , 20127 )
YU 141 ESC 2/8 7/10 ISO 646 JUS I.B1.002 ( YUSCII ) ex Yugoslavia ( croata , esloveno , serbio , bosnio )
INIS 49 ESC 2/8 5/7 OIEA INIS Subconjunto ISO 646 IRV

Derivados nacionales

También existen algunos conjuntos de caracteres nacionales que se basan en ISO 646 pero no siguen estrictamente su conjunto invariante (ver también § Derivados para otros alfabetos ):

Conjunto de caracteres ISO-IR ISO ESC Aprobado Norma nacional Descripción
BS_viewdata 47 ESC 2/8 5/6 Oficina de correos británica Ver datos y teletexto . El cuadro de datos de visualización (⌗) se sustituye por un subrayado normalmente invariante (_) que no se puede mostrar en el hardware de destino. Esta es en realidad la codificación de WST_Engl de Microsoft.
GR / griego7 88 ESC 2/8 6/10 ? HOS ELOT 927 Grecia (retirada en noviembre de 1986). Utiliza letras griegas en lugar de romanas y, por lo tanto, no es estrictamente una variante de ISO 646.
griego de 7 años 18 ESC 2/8 5/11 ECMA ? Conjunto gráfico griego. Similar en concepto a greek7 , pero usa un mapeo diferente de letras. Además, la mayúscula sigue a la minúscula.
Latín-griego 19 ESC 2/8 5/12 ECMA ? Gráficos combinados latín-griego (solo mayúsculas). Sigue a greek7-old , pero incluye mayúsculas latinas sin modificaciones y mayúsculas griegas sobre minúsculas latinas.
Latín-Griego-1 27 ESC 2/8 5/5 ECMA Honeywell-Bull Gráficos mixtos latín-griego (solo mayúsculas griegas). Unifica visualmente las capitales griegas con las latinas siempre que sea posible y agrega las mayúsculas griegas restantes. A diferencia de las otras versiones griegas, todas las letras latinas básicas permanecen intactas. Sin embargo, reemplaza la puntuación invariante así como los caracteres nacionales y, por lo tanto, todavía no es estrictamente hablando una variante de ISO 646.
swi - ECMA Olivetti Suiza ( francés , alemán ) ( página de códigos 1021 ) El punto de código invariable 0x5F se cambia de _a è. Es una variante de DEC NRCS , estrechamente relacionada con ISO 646, pero carece de un equivalente totalmente compatible con ISO 646.

Personajes de control

Todas las variantes enumeradas anteriormente son únicamente juegos de caracteres gráficos y se deben utilizar con un juego de caracteres de control C0 como el que se enumera en la siguiente tabla:

ISO-IR ISO ESC Aprobado Descripción
1 ESC 2/1 4/0 ISO 646 Controles ISO 646 ("controles ASCII")
7 ESC 2/1 4/1 ISO 646 Controles de periódicos escandinavos (NATS)
26 ESC 2/1 4/3 ISO 646 Controles IPTC

Conjuntos de caracteres complementarios asociados

La siguiente tabla enumera los conjuntos de caracteres gráficos complementarios definidos por el mismo estándar que las variantes específicas de ISO 646. Estos se seleccionarían mediante el uso de un mecanismo como shift out o el super shift de NATS (single shift), o configurando el octavo bit en entornos donde haya uno disponible:

ISO-IR ISO ESC Norma nacional Descripción
8-2 ESC 2/8 4/4 NATS-SEFI-ADD Código suplementario utilizado con NATS-SEFI.
9-2 ESC 2/8 4/6 NATS-DANO-ADD Código suplementario utilizado con NATS-DANO.
13 ESC 2/8 4/9 JIS C 6220: 1969-jp Katakana , utilizado como código complementario con ISO-646-JP.
103 ESC 2/8 7/6 Recomendación UIT / CCITT T.61 , conjunto suplementario Código suplementario utilizado con T.61.

Cuadro de comparación de variantes

Los detalles de los cambios para algunas de estas variantes se dan en la siguiente tabla. No se muestran las asignaciones de caracteres sin cambios en todas las variantes enumeradas (es decir, que siguen siendo las mismas que ASCII).

Para facilitar la comparación, las variantes detalladas incluyen variantes nacionales de ISO 646, la serie de conjuntos de caracteres de reemplazo nacional (NRCS) estrechamente relacionados de DEC que se utilizan en los terminales VT200 , la serie de codificación de teletexto del sistema mundial europeo relacionada definida en ETS 300706 y algunas otras estrechamente relacionadas codificaciones basadas en ISO 646. Las tablas de códigos individuales están vinculadas desde la segunda columna. Las celdas con fondo no blanco enfatizan las diferencias con US-ASCII (también el subconjunto latino básico de ISO / IEC 10646 y Unicode).

Se pueden usar varios caracteres como caracteres de combinación , cuando van precedidos o seguidos de un control C0 de retroceso . Esto se atestigua en las tablas de códigos para IRV, GB, FR1, CA y CA2, que señalan que se comportaría como diéresis , acento agudo , cedilla y circunflejo (en lugar de comillas , una coma y una punta de flecha hacia arriba ) cuando van precedidas o seguidas. por un retroceso. El carácter de tilde (~) se introdujo de manera similar como un diacrítico (˜). Este método de codificación se originó en la era de la máquina de escribir / teletipo , cuando el uso del retroceso sobresaltaría un glifo y podría considerarse obsoleto . "',^

Más tarde, cuando los conjuntos de caracteres más amplios ganaron más aceptación, ISO 8859 , los conjuntos de caracteres específicos del proveedor y, finalmente, Unicode se convirtieron en los métodos preferidos para codificar la mayoría de estas variantes.

Código de variante Gráfico de código Caracteres para cada juego de caracteres derivado o compatible con ISO 646 / NRCS
EE.UU. / IRV (1991) ISO-IR-006 ! " # PS Y : ? @ [ \ ] ^ _ ' { | } ~
Versiones de referencia internacional más antiguas
IRV (1973) ISO-IR-002 ! " # ¤ Y : ? @ [ \ ] ^ _ ' { | }
IRV (1983) CP01009 ! " # ¤ Y : ? @ [ \ ] ^ _ ' { | } ~
Invariante y otros subconjuntos de IRV
INV ISO-IR-170 ! "     Y : ?           _          
INV ( NRCS ) --- ! "   PS Y : ?                      
INV ( teletexto ) ETS WST ! "     Y : ?                      
Subconjunto INIS ISO-IR-049 PS : [ ] |
T.61 ISO-IR-102 ! " # ¤ Y : ? @ [   ]   _     |    
asiático del este
JP ISO-IR-014 ! " # PS Y : ? @ [ ¥ ] ^ _ ' { | }
JP-OCR-B ISO-IR-092 ! " # PS Y : ? @ [ ¥ ] ^ _   { | }  
KR (KS X 1003) ! " # PS Y : ? @ [ ] ^ _ ' { | }
CN ISO-IR-057 ! " # ¥ Y : ? @ [ \ ] ^ _ ' { | }
TW (CNS 5205) ! " # PS Y : ? @ [ \ ] ^ _ ' { | }
Británicos e irlandeses
GB ISO-IR-004 ! " £ PS Y : ? @ [ \ ] ^ _ ' { | }
GB ( NRCS ) CP01101 ! " £ PS Y : ? @ [ \ ] ^ _ ' { | } ~
Ver datos ISO-IR-047 ! " £ PS Y : ? @ ½ - ¼ ¾ ÷
ES DECIR ISO-IR-207 ! " £ PS Y : ? Ó MI I Ú A _ ó mi I ú a
Italophone o Francophone
ESO ISO-IR-015 ! " £ PS Y : ? § ° C mi ^ _ ù a ò mi I
IT ( teletexto ) ETS WST ! " £ PS Y : ? mi ° C ù a ò mi I
FR (1983) ISO-IR-069 ! " £ PS Y : ? a ° C § ^ _ µ mi ù mi ¨
FR (1973) ISO-IR-025 ! " £ PS Y : ? a ° C § ^ _ ' mi ù mi ¨
Teletexto FR ETS WST ! " mi I Y : ? a mi mi ù I mi a ô û C
California ISO-IR-121 ! " # PS Y : ? a a C mi I _ ô mi ù mi û
CA2 ISO-IR-122 ! " # PS Y : ? a a C mi MI _ ô mi ù mi û
Francófono-germanófono
swi ( NRCS ) CP01021 ! " ù PS Y : ? a mi C mi I mi ô a ö ü û
Germanófono
Delaware ISO-IR-021 ! " # PS Y : ? § A Ö Ü ^ _ ' a ö ü ß
Nórdico (oriental) y báltico
FI / SE ISO-IR-010 ! " # ¤ Y : ? @ A Ö A ^ _ ' a ö a
SE2 ISO-IR-011 ! " # ¤ Y : ? MI A Ö A Ü _ mi a ö a ü
SE ( NRCS ) CP01106 ! " # PS Y : ? MI A Ö A Ü _ mi a ö a ü
FI ( NRCS ) CP01103 ! " # PS Y : ? @ A Ö A Ü _ mi a ö a ü
SEFI (NATS) ISO-IR-008-1 ! " # PS Y : ?   A Ö A _ a ö a -
EE ( teletexto ) ETS WST ! " # õ Y : ? S A Ö Ž Ü Õ s a ö ž ü
LV / LT ( teletexto ) ETS WST ! " # PS Y : ? S mi mi Ž C ū s a ų ž I
Nórdico (occidental)
DK CP01017 ! " # ¤ Y : ? @ Æ Ø A Ü _ ' æ ø a ü
NS / NO ( NRCS ) CP01105 ! " # PS Y : ? A Æ Ø A Ü _ a æ ø a ü
DK / NO-alt ( NRCS ) CP01107 ! " # PS Y : ? @ Æ Ø A ^ _ ' æ ø a ~
NO ISO-IR-060 ! " # PS Y : ? @ Æ Ø A ^ _ ' æ ø a
NO2 ISO-IR-061 ! " § PS Y : ? @ Æ Ø A ^ _ ' æ ø a |
DANO (NATS) ISO-IR-009-1 ! « » PS Y : ?   Æ Ø A _ æ ø a -
ES ! " # ¤ Y : ? D Þ \ Æ Ö _ D þ | æ ö
Hispanohablante
ES ISO-IR-017 ! " £ PS Y : ? § ¡ NORTE ¿ ^ _ ' ° norte C ~
ES2 ISO-IR-085 ! " # PS Y : ? · ¡ NORTE C ¿ _ ' ´ norte C ¨
CU ISO-IR-151 ! " # ¤ Y : ? @ ¡ NORTE ] ¿ _ ' ´ norte [ ¨
Hispano-lusófono
Teletexto ES / PT ETS WST ! " C PS Y : ? ¡ a mi I ó ú ¿ ü norte mi a
Lusófono
PT ISO-IR-016 ! " # PS Y : ? § A C Õ ^ _ ' a C õ °
PT2 ISO-IR-084 ! " # PS Y : ? ´ A C Õ ^ _ ' a C õ ~
PT ( NRCS ) --- ! " # PS Y : ? @ A C Õ ^ _ ' a C õ ~
griego
Latin-GR mixto ISO-IR-027 Ξ " Γ ¤ Y Ψ Π Δ Ω Θ Φ Λ Σ ' { | }
ISO-IR-088 (GR / ELOT 927), ISO-IR-018 e ISO-IR-019 reemplazan las letras romanas por letras griegas y se detallan en un cuadro separado .
Eslavo (escritura latina)
YU ISO-IR-141 ! " # PS Y : ? Ž S DJ C C _ ž s DJ C C
YU Teletexto ETS WST ! " # MI Y : ? C C Ž DJ S mi C C ž DJ s
Teletexto YU-alt ETS WST ! " # PS Y : ? C C Ž DJ S mi C C ž DJ s
CS / CZ / SK ( teletexto ) ETS WST ! " # ů Y : ? C ť ž ý I ř mi a mi ú s
PL BN-74 / 3101-01 ! " # PLN Y : ? mi ź \ norte s _ a ó ł ż C
PL Teletexto ETS WST ! " # norte Y : ? a Ƶ S Ł C ó mi ż s ł ź
Las adaptaciones para la escritura cirílica reemplazan a las letras romanas y se detallan en una tabla separada.
Otro
NL CP01019 ! " # PS Y : ? @ [ \ ] ^ _ ' { | }
NL NRCS CP01102 ! " £ PS Y : ? ¾ ij ½ | ^ _ ' ¨ ƒ ¼ ´
HU ISO-IR-086 ! " # ¤ Y : ? A MI Ö Ü ^ _ a mi ö ü ˝
MONTE ! " # PS Y : ? @ gramo ż ħ ^ _ C GRAMO Ż Ħ C
RO ( teletexto ) ETS WST ! " # ¤ Y : ? Ţ A S A I I ţ a s a I
TR ( teletexto ) ETS WST ! " TL gramo Y : ? I S Ö C Ü GRAMO I s ö C ü

Derivadas para otros alfabetos

Algunos juegos de caracteres de 7 bits para alfabetos no latinos se derivan del estándar ISO 646: estos no constituyen en sí mismos ISO 646 debido a que no siguen sus puntos de código invariantes (a menudo reemplazan las letras de al menos un caso), debido a que admiten diferencias alfabetos para los que el conjunto de puntos de código nacional proporciona un espacio de codificación insuficiente. Ejemplos incluyen:

  • Turcomano de 7 bits (ISO-IR-230).
  • Griego de 7 bits.
    • En ELOT 927 (ISO-IR-088), el alfabeto griego se asigna en orden alfabético (excepto para el sigma final) a las posiciones 0x61–0x71 y 0x73–0x79, encima de las letras minúsculas latinas.
    • ISO-IR-018 mapea el alfabeto griego sobre ambas letras usando un esquema diferente (no en orden alfabético, pero tratando cuando sea posible de hacer coincidir letras griegas sobre letras romanas que corresponden en algún sentido), e ISO-IR-019 mapea el griego alfabeto en mayúsculas sobre las letras minúsculas latinas utilizando el mismo esquema que ISO-IR-018.
    • La mitad inferior de la codificación de caracteres de la fuente Symbol usa su propio esquema para mapear letras griegas de ambos casos sobre las letras ASCII romanas, también tratando de mapear letras griegas sobre letras romanas que corresponden en algún sentido, pero tomando decisiones diferentes al respecto (ver cuadro a continuación). También reemplaza los puntos de código invariantes 0x22 y 0x27 y cinco puntos de código nacional con símbolos matemáticos. Aunque no está diseñado para su uso en la composición tipográfica de la prosa griega, a veces se usa con ese propósito.
    • ISO-IR-027 (detallado en la tabla de arriba en lugar de abajo) incluye el alfabeto latino sin cambios, pero agrega algunas letras mayúsculas griegas que no se pueden representar con homoglyphs latinos ; si bien se basa explícitamente en ISO 646, algunos de estos se asignan a puntos de código que son invariantes en ISO 646 (0x21, 0x3A y 0x3F) y, por lo tanto, no es una verdadera variante de ISO 646.
    • La codificación del teletexto del sistema mundial para el griego utiliza otro esquema de mapeo de las letras griegas en orden alfabético sobre las letras ASCII de ambos casos, incluyendo en particular varias letras con signos diacríticos.
  • Cirílico de 7 bits
    • KOI-7 o KOI corto, usado para ruso . Los caracteres cirílicos se asignan a las posiciones 0x60–0x7E, encima de las letras minúsculas latinas, haciendo coincidir las letras homólogas cuando sea posible (donde в se asigna a w, no v). Reemplazado por las variantes KOI-8 .
    • SRPSCII y MAKSCII , variantes cirílicas de YUSCII (la variante latina es YU / ISO-IR-141 en el cuadro anterior), utilizadas para serbio y macedonio respectivamente. En gran parte homóloga a la variante de América de YUSCII (siguiendo Serbio digraphia reglas ), a excepción de Љ (LJ), Њ (nj), Џ (DZ) y ѕ (dz), que corresponden a dígrafos en ortografía América-script , y se asignan sobre letras que no se utilizan en serbio o macedonio (q, w, x, y).
    • Los conjuntos G0 para las codificaciones de teletexto del sistema mundial para ruso / búlgaro y ucraniano utilizan conjuntos G0 similares a KOI-7 con algunas modificaciones. El conjunto G0 correspondiente para cirílico serbio utiliza un esquema basado en la codificación de teletexto para serbocroata y esloveno de escritura latina , a diferencia del YUSCII significativamente diferente.
  • Hebreo de 7 bits, SI 960 . El alfabeto hebreo se asigna a las posiciones 0x60–0x7A, encima de las letras latinas minúsculas (y acento grave para aleph). El hebreo de 7 bits siempre se almacenaba en orden visual. Este mapeo con el bit alto establecido, es decir, con las letras hebreas en 0xE0–0xFA, es ISO 8859-8 . La codificación del teletexto del sistema mundial para hebreo usa las mismas asignaciones de letras, pero usa BS_Viewdata como su codificación base (mientras que SI 960 usa US-ASCII) e incluye un signo de shekel en 0x7B.
  • Árabe de 7 bits, OMAPE 449 (ISO-IR-089). El alfabeto árabe se asigna a las posiciones 0x41–0x5A y 0x60–0x6A, encima de las letras latinas mayúsculas y minúsculas.

A continuación se muestra una comparación de algunas de estas codificaciones. Solo se muestra un caso, excepto en los casos en los que los casos se asignan a letras diferentes. En tales casos, se muestra primero el mapeo con el código más pequeño. Se dan posibles transcripciones para algunas letras; donde se omite, se puede considerar que la letra corresponde a la romana sobre la que está mapeada.

Inglés
( ASCII )
Alfabetos cirílicos Alfabeto griego hebreo
Semitransliterativo Naturalmente ordenado
Ruso
( KOI-7 )
Ruso,
búlgaro
( WST
RU / BG
)
Ucraniano
( WST UKR )
Serbio
( SRPSCII )
Macedonio
( MAKSCII )
Serbio,
macedonio
( WST SRP )
Griego
( símbolo )
Griego
(IR-18)
Griego
( ELOT 927 )
Griego
( WST EL )
Hebreo
( SI 960 )
@
'
Ю (ju / yu) Ю (ju / yu) Ю (ju / yu) Ж (ž) Ж (ž) Ч (č)
´
`
@
'
ΐ
ΰ
א (ʾ / ʔ)
A А А (a / á) А А А А Α Α Α Α ב (b)
B Á Á Á Á Á Á Β Β Β Β ג (g)
C Ц (c / ts) Ц (c / ts) Ц (c / ts) Ц (c / ts) Ц (c / ts) Ц (c / ts) Χ (ch / kh) Ψ (ps) Γ (g) Γ (g) ד (d)
D Д Д Д Д Д Д Δ Δ Δ Δ ה (h)
mi Е (je / ye) Е (je / ye) Е (e) Е (e) Е (e) Е (e) Ε Ε Ε Ε ו (w)
F Ф Ф Ф Ф Ф Ф Φ (ph / f) Φ (ph / f) Ζ (z) Ζ (z) ז (z)
GRAMO Г Г Г Г Г Γ Γ Γ Η (ē) Η (ē) ח (ch / kh)
H Х (h / kh / ch) Х (h / kh / ch) Х (h / kh / ch) Х (h / kh / ch) Х (h / kh / ch) Х (h / kh / ch) Η (ē) Η (ē) Θ (th) Θ (th) ט (tt)
I И И И (y) И И И Ι Ι Ι Ι י (j / año)
J Й (j / año) Й (j / año) Й (j / año) Ј (j / año) Ј (j / año) Ј (j / año) ϑ (th)
ϕ (ph / f)
Ξ (x / ks)   Κ (k) ך (k final)
K К К К К К К Κ Κ Κ Λ (l) כ
L Л Л Л Л Л Л Λ Λ Λ Μ (m) ל
METRO М М М М М М Μ Μ Μ Ν (n) ם (m final)
norte Н Н Н Н Н Н Ν Ν Ν Ξ (x / ks) מ (m)
O О О О О О О Ο Ο Ξ (x / ks) Ο ן (n final)
PAG П П П П П П Π Π Ο (o) Π נ (n)
Q Я (ja / ya) Я (ja / ya) Я (ja / ya) Љ (lj / ly) Љ (lj / ly) Ќ (Ḱ / kj) Θ (th) ͺ ( i ) Π (p) Ρ (r) ס (s)
R Р Р Р Р Р Р Ρ Ρ Ρ ʹ
ς (s final)
ע (ʽ / ŋ)
S С С С С С С Σ Σ Σ Σ ף (p final)
T Т Т Т Т Т Т Τ Τ Τ Τ פ (p)
U У У У У У У Υ Θ (th) Υ Υ ץ (ṣ / ts final)
V Ж (ž) Ж (ž) Ж (ž) В В В ς (s final)
ϖ (p)
Ω (ō) Φ (f / ph) Φ (f / ph) צ (ṣ / ts)
W В (v) В (v) В (v) Њ (nj / ny / ñ) Њ (nj / ny / ñ) Ѓ (ǵ / gj) Ω (ō) ς (s final) ς (s final) Χ (ch / kh) ק (q)
X Ь (') Ь (') Ь (') Џ (dž) Џ (dž) Љ (lj / ly) Ξ Χ (ch / kh) Χ (ch / kh) Ψ (ps) ר (r)
Y Ы (y / ı) Ъ (″ / ǎ / ŭ) І (i) Ѕ (dz) Ѕ (dz) Њ (nj / ny / ñ) Ψ (ps) Υ (u) Ψ (ps) Ω (ō) ש (š / sh)
Z З З З З З З Ζ Ζ Ω (ō) Ϊ ת (t)
[
{
Ш (š / sh) Ш (š / sh) Ш (š / sh) Ш (š / sh) Ш (š / sh) Ћ (ć) [
{
᾿̃
῾̃
[
{
Ϋ [
{
\
|
Э (e) Э (e) Є (je / ye) Ђ (đ / dj) Ѓ (ǵ / gj) Ж (ž)
|

(H)
\
|
ά
ό
\
|
]
}
Щ (šč) Щ (šč) Щ (šč) Ћ (ć) Ќ (Ḱ / kj) Ђ (đ / dj) ]
}
᾿ '
῾'
]
}
varepsilon
upsilon
]
}
^
~
Ч (č) Ч (č) Ч (č) Ч (č) Ч (č) Ш (š / sh)
~
˜
¨
^
ή
ώ
^
_ Ъ (″) Ы (y / ı) Ї (ji / yi) _ _ Џ (dž) _ _ _ ί _

Ver también

Notas al pie

Referencias

Otras lecturas

enlaces externos