VISCII - VISCII
MIME / IANA | VISCII |
---|---|
Idioma (s) | Vietnamita , inglés |
Creado por | Grupo Viet-Std |
Definiciones | RFC 1456 |
Clasificación | SBCS de 8 bits |
Residencia en | ASCII |
VISCII es una codificación de caracteres ASCII modificada definida no oficialmente para usar el idioma vietnamita con computadoras . No debe confundirse con la codificación VSCII registrada oficialmente con un nombre similar . VISCII mantiene los 95 caracteres imprimibles de ASCII sin modificar, pero reemplaza 6 de los 33 caracteres de control con caracteres imprimibles. Agrega 128 caracteres precompuestos . Unicode y la página de códigos de Windows-1258 ahora se utilizan para prácticamente todos los datos informáticos vietnamitas, pero los archivos VSCII y VISCII heredados pueden necesitar conversión.
Historia y naming
VISCII fue diseñado por el Grupo de Trabajo de Estandarización de Vietnam (Viet-Std Group) dirigido por Christopher Cuong T.Nguyen, Cuong M. Bui y Hoc D. Ngo con sede en Silicon Valley , California en 1992 mientras trabajaban con el consorcio Unicode para incluir caracteres vietnamitas precompuestos en el estándar Unicode. VISCII, junto con VIQR , se publicó por primera vez en un informe bilingüe en septiembre de 1992, en el que se denominó "Código estándar vietnamita para el intercambio de información". El informe señaló una proliferación en el uso de computadoras en Vietnam y el creciente volumen de comunicaciones por computadora entre los vietnamitas en el extranjero, que las aplicaciones existentes usaban codificaciones específicas del proveedor que no podían interoperar entre sí y que , por lo tanto, era necesaria la estandarización entre los proveedores. La inclusión exitosa de vietnamitas compuestos y precompuestos en Unicode 1.0 fue el resultado de las lecciones aprendidas del desarrollo de VISCII de 8 bits y VIQR de 7 bits.
Al año siguiente, en 1993, Vietnam adoptó TCVN 5712 , su primer estándar nacional en el dominio de la tecnología de la información . Esto define una codificación de caracteres nombrado VSCII , que había sido desarrollado por el TCVN Comité Técnico de Tecnología de la Información (TCVN / TC1), y con su nombre que significa "Código Estándar vietnamita para el Intercambio de Información". VSCII es incompatible con el VISCII publicado anteriormente y no está relacionado con él. A diferencia de VISCII, VSCII es un "estándar vietnamita" en el sentido de un estándar nacional .
VISCII y VIQR fueron aprobados como RFC 1456 de estado informativo , atribuido al grupo Viet-Std y con fecha de mayo de 1993. Como es el caso de las RFC de IETF, RFC 1456 señala que son "convenciones" utilizadas por hablantes de vietnamita en el extranjero en Usenet , y que "no especifica ningún nivel de estándar". A pesar de esto, continúa llamando a VISCII el "Código estándar de VIetnamese para el intercambio de información" (el mismo nombre que toma VSCII). Las etiquetas VISCII
y csVISCII
están registradas en la IANA para VISCII, con referencia a RFC 1456. (Por otro lado, no existe una etiqueta oficial de IANA para TCVN 5712 / VSCII, aunque x-viet-tcvn5712
anteriormente era compatible con Mozilla Firefox ).
Diseño
Un conjunto de caracteres ASCII extendido tradicional consta del conjunto ASCII más hasta 128 caracteres. El vietnamita requiere 134 combinaciones de letras y diacríticos adicionales, que son seis de más. Hay ( salvo eliminar el soporte de marca de tono para letras mayúsculas, como en VSCII-3 ) esencialmente cuatro formas diferentes de manejar este problema:
- Utilice codificación de ancho variable (al igual que UTF-8 )
- Incluya la combinación de marcas diacríticas para marcas de tono (al igual que VSCII-2 y Windows-1258 ) o para los diacríticos en general (al igual que ANSEL y VNI )
- Reemplace algunos signos de puntuación ASCII, preferiblemente signos de puntuación que no sean invariantes en ISO 646 (al igual que VNI para DOS )
- Reemplace al menos seis de los caracteres de control ASCII básicos (al igual que VPS y VSCII-1 )
VISCII optó por la última opción, reemplazando seis de los códigos de control C0 (STX, ENQ, ACK, DC4, EM y RS) menos problemáticos (por ejemplo, los que tienen menos probabilidades de ser reconocidos por una aplicación y de que se actúe especialmente ) con seis de los combinaciones de letras mayúsculas y diacríticas menos utilizadas. Si bien esta opción puede hacer que los programas que usan esos códigos de control no funcionen correctamente al manejar el texto VISCII, crea menos complicaciones que las otras dos opciones (los diseñadores señalan que se ha descubierto que la transmisión limpia que no es de 8 bits presenta más dificultades en la práctica que la reutilización de caracteres de control). No obstante, las ubicaciones de los caracteres de control C0 o C1 y los códigos utilizados para el espacio no divisible en ISO-8859-1 , Mac OS Roman y OEM-US se asignaron deliberadamente a letras mayúsculas, con la intención de hacer uso de puntos de código en minúsculas. con una fuente en mayúsculas, una solución alternativa útil si los caracteres gráficos no se pudieran mostrar para esos códigos.
Sin embargo, el uso de todos los puntos de código extendido para letras acentuadas no dejaba espacio para agregar símbolos útiles, números en superíndice, comillas curvas, guiones adecuados, etc., como la mayoría de los otros conjuntos de caracteres ASCII extendidos.
La ubicación de los caracteres sigue deliberadamente en su mayoría ISO-8859-1 donde hay caracteres en común entre las dos páginas de códigos (la mayúscula Õ se señala como una excepción), motivada por preocupaciones de facilidad de uso.
Apoyo
VISCII cuenta con el apoyo parcial de TriChlor Software Group en California, que ha lanzado varios paquetes de software, bibliotecas y fuentes compatibles con VISCII para MS-DOS y Windows, Unix y Macintosh. El software compatible con VISCII está disponible en muchos sitios FTP .
VISCII se ofreció históricamente como una codificación para el correo electrónico saliente por Mozilla Thunderbird . También fue compatible con el software de teclado vietnamita de Windows, WinVNKey, creado por Christopher Cuong T. Nguyen y luego actualizado a través de varias versiones de Windows por Hoc D. Ngo y otros.
VISCII fue utilizado principalmente por hablantes de vietnamita en el extranjero, siendo VSCII (TCVN) más popular en el norte de Vietnam y VNI más popular en el sur de Vietnam.
Conjunto de caracteres
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 |
NUL 0000 |
SOH 0001 |
Ẳ 1EB2 |
ETX 0003 |
EOT 0004 |
Ẵ 1EB4 |
Ẫ 1EAA |
BEL 0007 |
BS 0008 |
HT 0009 |
LF 000A |
VT 000B |
FF 000C |
CR 000D |
SO 000E |
SI 000F |
1_ 16 |
DLE 0010 |
DC1 0011 |
DC2 0012 |
DC3 0013 |
Ỷ 1EF6 |
NAK 0015 |
SYN 0016 |
ETB 0017 |
PUEDE 0018 |
Ỹ 1EF8 |
SUB 001A |
ESC 001B |
FS 001C |
GS 001D |
Ỵ 1EF4 |
US 001F |
2_ 32 |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
$ 0024 |
% 0025 |
& 0026 |
« 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ 48 |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
4_ 64 |
@ 0040 |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Yo 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
5_ 80 |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
6_ 96 |
` 0060 |
un 0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
g 0067 |
h 0068 |
yo 0069 |
j 006A |
k 006B |
l 006C |
m 006D |
n 006E |
o 006F |
7_ 112 |
p 0070 |
q 0071 |
r 0072 |
s 0073 |
t 0074 |
u 0075 |
v 0076 |
w 0077 |
x 0078 |
y 0079 |
z 007A |
{ 007B |
| 007C |
} 007D |
~ 007E |
DEL 007F |
8_ 128 |
Ạ 1EA0 |
Ắ 1EAE |
Ằ 1EB0 |
Ặ 1EB6 |
Ấ 1EA4 |
Ầ 1EA6 |
Ẩ 1EA8 |
Ậ 1EAC |
Ẽ 1EBC |
Ẹ 1EB8 |
Ế 1EBE |
Ề 1EC0 |
Ể 1EC2 |
Ễ 1EC4 |
Ệ 1EC6 |
Ố 1ED0 |
9_ 144 |
Ồ 1ED2 |
Ổ 1ED4 |
Ỗ 1ED6 |
Ộ 1ED8 |
Ợ 1EE2 |
Ớ 1EDA |
Ờ 1EDC |
Ở 1EDE |
Ị 1ECA |
Ỏ 1ECE |
Ọ 1ECC |
Ỉ 1EC8 |
Ủ 1EE6 |
× 0168 |
Ụ 1EE4 |
Ỳ 1EF2 |
A_ 160 |
Õ 00D5 |
ắ 1EAF |
ằ 1EB1 |
 1EB7 |
ấ 1EA5 |
ầ 1EA7 |
ẩ 1EA9 |
 1EAD |
ẽ 1EBD |
E 1EB9 |
E 1EBF |
ề 1EC1 |
ể 1EC3 |
ễ 1EC5 |
E 1EC7 |
ố 1ED1 |
B_ 176 |
ồ 1ED3 |
ổ 1ED5 |
ỗ 1ED7 |
Ỡ 1EE0 |
Ơ 01A0 |
ộ 1ED9 |
ờ 1EDD |
ở 1EDF |
ị 1ECB |
Ự 1EF0 |
Ứ 1EE8 |
Ừ 1EEA |
Ử 1EEC |
ơ 01A1 |
ớ 1EDB |
Ư 01AF |
C_ 192 |
À 00C0 |
Á 00C1 |
 00C2 |
à 00C3 |
Ả 1EA2 |
Ă 0102 |
ẳ 1EB3 |
ẵ 1EB5 |
È 00C8 |
É 00C9 |
Ê 00CA |
Ẻ 1EBA |
Ì 00CC |
Í 00CD |
Ĩ 0128 |
ỳ 1EF3 |
D_ 208 |
Đ 0110 |
ứ 1EE9 |
Ò 00D2 |
Ó 00D3 |
Ô 00D4 |
ạ 1EA1 |
ÿ 1EF7 |
ừ 1EEB |
ử 1EED |
Ù 00D9 |
Ú 00DA |
ỹ 1EF9 |
ỵ 1EF5 |
Ý 00DD |
ỡ 1EE1 |
ư 01B0 |
E_ 224 |
à 00E0 |
á 00E1 |
â 00E2 |
ã 00E3 |
ả 1EA3 |
ă 0103 |
ữ 1EEF |
ẫ 1EAB |
è 00E8 |
é 00E9 |
ê 00EA |
ẻ 1EBB |
ì 00EC |
í 00ED |
ĩ 0129 |
ỉ 1EC9 |
F_ 240 |
đ 0111 |
ự 1EF1 |
ò 00F2 |
ó 00F3 |
ô 00F4 |
õ 00F5 |
ỏ 1ECF |
ọ 1ECD |
ụ 1EE5 |
ù 00F9 |
ú 00FA |
ũ 0169 |
ủ 1EE7 |
ý 00FD |
ợ 1EE3 |
Ữ 1EEE |
Carta Número Puntuación Símbolo Otro Indefinido
Las diferencias con ISO-8859-1 se muestran sombreadas.
Ver también
- ASCII
- Vietnamita citado-legible (VIQR)
- Código estándar vietnamita para el intercambio de información (VSCII)
- Windows-1258
Referencias
Otras lecturas
- Flohr, Guido (2016) [2006]. "Locale :: RecodeData :: VISCII - Rutinas de conversión para VISCII" . CPAN libintl-perl . Archivado desde el original el 14 de enero de 2017 . Consultado el 14 de enero de 2017 .
- https://www.math.nmsu.edu/~mleisher/Software/csets/VISCII.TXT
enlaces externos
- RFC 1456 - Convenciones para codificar el idioma vietnamita
- Grupo de trabajo de estandarización vietnamita con sede en California
- Informe Viet-Std 1992
- Software AnGiang
- Software y fuentes compatibles con VISCII para MS-DOS y Windows
- Software, bibliotecas y fuentes compatibles con VISCII para Unix
- WinVNKey , controlador de teclado vietnamita para Windows compatible con conjuntos de caracteres multinacionales, incluido VISCII
- MacVNKey , controlador de teclado compatible con VISCII para Macintosh classic