在电子计算机内关于汉字的机内码介绍?
作者&投稿:幸独 (若有异议请与网页底部的电邮联系)
~
保存一个汉字的区位码要占用两个字节,区号、位号各占一个字节。区号、位号都不超过94,所以这两个字节的最高位仍然是“0”。为了避免汉字区位与ASCII码无法区分,汉字在计算机内的保存采用了机内码,也称汉字的内码。目前占主导地位的汉字机内码是将区码和位码分别加上数AOH作为机内码。如“啊”字的区位码的十六进制表示为1001H,而“啊”字的机内码则为 BOAIH。这样汉字机内码的两个字节的最高位均为“1”,很容易与西文的ASCII码区分。以GB2312——80国家标准制定的汉字机内码也称为GB2312码。它和国标区位码的换算关系是:
机内码=区位码+A0A0H
像英文字符一样,汉字在排序时所依据的大小关系也是根据它的编码的大小来确定的,即分在不同区里的汉字由机内码的第1字节决定大小,在同一区中的汉字由第2字节的大小来决定。由于汉字的内码都大于128,所以汉字无论是高位内码还是低位内码都大于ASCII码(仅对GB2312码而言)。
需要说明的是,在我国的台湾省,目前广泛使用的是“大五码(BIG—5)”,对于这种内码,一个汉字也是两个字节表示,共表示了13053个汉字
机内码=区位码+A0A0H
像英文字符一样,汉字在排序时所依据的大小关系也是根据它的编码的大小来确定的,即分在不同区里的汉字由机内码的第1字节决定大小,在同一区中的汉字由第2字节的大小来决定。由于汉字的内码都大于128,所以汉字无论是高位内码还是低位内码都大于ASCII码(仅对GB2312码而言)。
需要说明的是,在我国的台湾省,目前广泛使用的是“大五码(BIG—5)”,对于这种内码,一个汉字也是两个字节表示,共表示了13053个汉字