VISCII - VISCII

VISCII
MIME / IANA VISCII
Idioma (s) Vietnamita , inglés
Creado por Grupo Viet-Std
Definiciones RFC  1456
Clasificación SBCS de 8 bits
Residencia en ASCII

VISCII es una codificación de caracteres ASCII modificada definida no oficialmente para usar el idioma vietnamita con computadoras . No debe confundirse con la codificación VSCII registrada oficialmente con un nombre similar . VISCII mantiene los 95 caracteres imprimibles de ASCII sin modificar, pero reemplaza 6 de los 33 caracteres de control con caracteres imprimibles. Agrega 128 caracteres precompuestos . Unicode y la página de códigos de Windows-1258 ahora se utilizan para prácticamente todos los datos informáticos vietnamitas, pero los archivos VSCII y VISCII heredados pueden necesitar conversión.

Historia y naming

VISCII fue diseñado por el Grupo de Trabajo de Estandarización de Vietnam (Viet-Std Group) dirigido por Christopher Cuong T.Nguyen, Cuong M. Bui y Hoc D. Ngo con sede en Silicon Valley , California en 1992 mientras trabajaban con el consorcio Unicode para incluir caracteres vietnamitas precompuestos en el estándar Unicode. VISCII, junto con VIQR , se publicó por primera vez en un informe bilingüe en septiembre de 1992, en el que se denominó "Código estándar vietnamita para el intercambio de información". El informe señaló una proliferación en el uso de computadoras en Vietnam y el creciente volumen de comunicaciones por computadora entre los vietnamitas en el extranjero, que las aplicaciones existentes usaban codificaciones específicas del proveedor que no podían interoperar entre sí y que , por lo tanto, era necesaria la estandarización entre los proveedores. La inclusión exitosa de vietnamitas compuestos y precompuestos en Unicode 1.0 fue el resultado de las lecciones aprendidas del desarrollo de VISCII de 8 bits y VIQR de 7 bits.

Al año siguiente, en 1993, Vietnam adoptó TCVN 5712 , su primer estándar nacional en el dominio de la tecnología de la información . Esto define una codificación de caracteres nombrado VSCII , que había sido desarrollado por el TCVN Comité Técnico de Tecnología de la Información (TCVN / TC1), y con su nombre que significa "Código Estándar vietnamita para el Intercambio de Información". VSCII es incompatible con el VISCII publicado anteriormente y no está relacionado con él. A diferencia de VISCII, VSCII es un "estándar vietnamita" en el sentido de un estándar nacional .

VISCII y VIQR fueron aprobados como RFC  1456 de estado informativo , atribuido al grupo Viet-Std y con fecha de mayo de 1993. Como es el caso de las RFC de IETF, RFC 1456 señala que son "convenciones" utilizadas por hablantes de vietnamita en el extranjero en Usenet , y que "no especifica ningún nivel de estándar". A pesar de esto, continúa llamando a VISCII el "Código estándar de VIetnamese para el intercambio de información" (el mismo nombre que toma VSCII). Las etiquetas VISCIIy csVISCIIestán registradas en la IANA para VISCII, con referencia a RFC 1456. (Por otro lado, no existe una etiqueta oficial de IANA para TCVN 5712 / VSCII, aunque x-viet-tcvn5712anteriormente era compatible con Mozilla Firefox ).

Diseño

Un conjunto de caracteres ASCII extendido tradicional consta del conjunto ASCII más hasta 128 caracteres. El vietnamita requiere 134 combinaciones de letras y diacríticos adicionales, que son seis de más. Hay ( salvo eliminar el soporte de marca de tono para letras mayúsculas, como en VSCII-3 ) esencialmente cuatro formas diferentes de manejar este problema:

  1. Utilice codificación de ancho variable (al igual que UTF-8 )
  2. Incluya la combinación de marcas diacríticas para marcas de tono (al igual que VSCII-2 y Windows-1258 ) o para los diacríticos en general (al igual que ANSEL y VNI )
  3. Reemplace algunos signos de puntuación ASCII, preferiblemente signos de puntuación que no sean invariantes en ISO 646 (al igual que VNI para DOS )
  4. Reemplace al menos seis de los caracteres de control ASCII básicos (al igual que VPS y VSCII-1 )

VISCII optó por la última opción, reemplazando seis de los códigos de control C0 (STX, ENQ, ACK, DC4, EM y RS) menos problemáticos (por ejemplo, los que tienen menos probabilidades de ser reconocidos por una aplicación y de que se actúe especialmente ) con seis de los combinaciones de letras mayúsculas y diacríticas menos utilizadas. Si bien esta opción puede hacer que los programas que usan esos códigos de control no funcionen correctamente al manejar el texto VISCII, crea menos complicaciones que las otras dos opciones (los diseñadores señalan que se ha descubierto que la transmisión limpia que no es de 8 bits presenta más dificultades en la práctica que la reutilización de caracteres de control). No obstante, las ubicaciones de los caracteres de control C0 o C1 y los códigos utilizados para el espacio no divisible en ISO-8859-1 , Mac OS Roman y OEM-US se asignaron deliberadamente a letras mayúsculas, con la intención de hacer uso de puntos de código en minúsculas. con una fuente en mayúsculas, una solución alternativa útil si los caracteres gráficos no se pudieran mostrar para esos códigos.

Sin embargo, el uso de todos los puntos de código extendido para letras acentuadas no dejaba espacio para agregar símbolos útiles, números en superíndice, comillas curvas, guiones adecuados, etc., como la mayoría de los otros conjuntos de caracteres ASCII extendidos.

La ubicación de los caracteres sigue deliberadamente en su mayoría ISO-8859-1 donde hay caracteres en común entre las dos páginas de códigos (la mayúscula Õ se señala como una excepción), motivada por preocupaciones de facilidad de uso.

Apoyo

VISCII cuenta con el apoyo parcial de TriChlor Software Group en California, que ha lanzado varios paquetes de software, bibliotecas y fuentes compatibles con VISCII para MS-DOS y Windows, Unix y Macintosh. El software compatible con VISCII está disponible en muchos sitios FTP .

VISCII se ofreció históricamente como una codificación para el correo electrónico saliente por Mozilla Thunderbird . También fue compatible con el software de teclado vietnamita de Windows, WinVNKey, creado por Christopher Cuong T. Nguyen y luego actualizado a través de varias versiones de Windows por Hoc D. Ngo y otros.

VISCII fue utilizado principalmente por hablantes de vietnamita en el extranjero, siendo VSCII (TCVN) más popular en el norte de Vietnam y VNI más popular en el sur de Vietnam.

Conjunto de caracteres

VISCII
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _MI _F
0_
0
NUL
0000
SOH
0001

1EB2
ETX
0003
EOT
0004

1EB4

1EAA
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
SO
000E
SI
000F
1_
16
DLE
0010
DC1
0011
DC2
0012
DC3
0013

1EF6
NAK
0015
SYN
0016
ETB
0017
PUEDE
0018

1EF8
SUB
001A
ESC
001B
FS
001C
GS
001D

1EF4
US
001F
2_
32
SP
0020
!
0021
"
0022
#
0023
$
0024
%
0025
&
0026
«
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
A
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
Yo
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
5_
80
P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060
un
0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
h
0068
yo
0069
j
006A
k
006B
l
006C
m
006D
n
006E
o
006F
7_
112
p
0070
q
0071
r
0072
s
0073
t
0074
u
0075
v
0076
w
0077
x
0078
y
0079
z
007A
{
007B
|
007C
}
007D
~
007E
DEL
007F
8_
128

1EA0

1EAE

1EB0

1EB6

1EA4

1EA6

1EA8

1EAC

1EBC

1EB8

1EBE

1EC0

1EC2

1EC4

1EC6

1ED0
9_
144

1ED2

1ED4

1ED6

1ED8

1EE2

1EDA

1EDC

1EDE

1ECA

1ECE

1ECC

1EC8

1EE6
×
0168

1EE4

1EF2
A_
160
Õ
00D5

1EAF

1EB1
Â
1EB7

1EA5

1EA7

1EA9
Â
1EAD

1EBD
E
1EB9
E
1EBF

1EC1

1EC3

1EC5
E
1EC7

1ED1
B_
176

1ED3

1ED5

1ED7

1EE0
Ơ
01A0

1ED9

1EDD

1EDF

1ECB

1EF0

1EE8

1EEA

1EEC
ơ
01A1

1EDB
Ư
01AF
C_
192
À
00C0
Á
00C1
Â
00C2
Ã
00C3

1EA2
Ă
0102

1EB3

1EB5
È
00C8
É
00C9
Ê
00CA

1EBA
Ì
00CC
Í
00CD
Ĩ
0128

1EF3
D_
208
Đ
0110

1EE9
Ò
00D2
Ó
00D3
Ô
00D4

1EA1
ÿ
1EF7

1EEB

1EED
Ù
00D9
Ú
00DA

1EF9

1EF5
Ý
00DD

1EE1
ư
01B0
E_
224
à
00E0
á
00E1
â
00E2
ã
00E3

1EA3
ă
0103

1EEF

1EAB
è
00E8
é
00E9
ê
00EA

1EBB
ì
00EC
í
00ED
ĩ
0129

1EC9
F_
240
đ
0111

1EF1
ò
00F2
ó
00F3
ô
00F4
õ
00F5

1ECF

1ECD

1EE5
ù
00F9
ú
00FA
ũ
0169

1EE7
ý
00FD

1EE3

1EEE

  Carta  Número  Puntuación  Símbolo  Otro  Indefinido

Las diferencias con ISO-8859-1 se muestran sombreadas.

Ver también

Referencias

Otras lecturas

enlaces externos