简述汉字内码与外码有何不同简述计算机的内码和外码有什么区别

作者&投稿：殷勤贾（若有异议请与网页底部的电邮联系）

11汉字的内码和外码有什么区别？~

输入码：

又称汉字外码，无论是区位码或国标码都不利于输入汉字，为方便汉字的输入而制定的汉字编码，称为汉字输入码。汉字输入码属于外码。不同的输入方法，形成了不同的汉字外码。常见的输入法有以下几类：

按汉字的排列顺序形成的编码（流水码）：如区位码；

按汉字的读音形成的编码（音码）：如全拼、简拼、双拼等；

按汉字的字形形成的编码（形码）：如五笔字型、郑码等；

按汉字的音、形结合形成的编码（音形码）：如自然码、智能ABC

国标码：

计算机只识别由0、1组成的代码，ASCII码是英文信息处理的标准编码，汉字信息处理也必须有一个统一的标准编码，所以国标码应运而生。所谓“国标码”，是指国家标准汉字编码。一般是指国家标准局1981年发布的《信息交换用汉字编码字符集（基本集）》，简称GB-2312。在这个集中，收进汉字6763个，其中一级汉字3755个，二级汉字3008个。一级汉字为常用字，按拼音顺序排列，二级汉字为次常用字，按部首排列。

区位码：

简单地理解的话，区位码就是国标码，但也是有些区别的，

在GB-2312中预留了一些空位，可以进行补充、扩展，经扩展的区位码就从数量、范围上超过了GB-2312（6763）了。上面是就大陆而言的，台湾、香港、和其他汉语国家，也是用区位码，但他们的区位号与大陆用的就不一定相同了。

机内码（汉字内码）：

计算机还不能将国标码作为汉字在计算机中的机内码，因为会和ASCII码发生冲突，如“保”，国标码为31H和23H，而西文字符“1”和“#”的SCII也为31H和23H，现假如内存中有两个字节为31H和23H，;这到底是一个汉字?，还是两个西文字符“1”;和“#”呢，于是就有了冲突。所以国家标准规定将汉字国标码每个字节的最高位统一规定为“1”作为识别汉字代码的标志，首位是“0”即为字符，首位是“1”即为汉字，这样就形成了机内码。汉字在计算机中是用机内码来表示的。

区位码，国标码，机内码的转换

（1）区位码先转换成十六进制数表示

（2）（区位码的十六进制表示）＋2020H＝国标码；

（3）国标码＋8080H＝机内码

字型码

汉字输出码提供输出汉字时所需要的汉字字型，用以将机内码还原为汉字进行输出。由于汉字是由笔画组成的方字，所以对汉字来讲，不论其笔画多少，都可以放在相同大小的方框里，如用M行N列的小圆点组成的方块（称为汉字的字模点阵），那么每个汉字都可以用点阵中的一些点组成。每个点用一位二进制表示，有笔形的为1，否则为0，就可得到该汉字的字形码。全部汉字字码的集合叫汉字字库。

总的来说，为方便汉字输入而形成的汉字编码为输入码，属于汉字的外码，输入码因编码方式不同而不同。为在计算机内表示汉字而统一的编码方式形成汉字编码叫国标码，计算机还不能将国标码作为汉字在计算机中的表现形式，因为会和ASCII码发生冲突，所以又产生了汉字的机内码，机内码是惟一的。为显示和打印输出汉字而形成的汉字编码为字型码，计算机通过汉字内码在字模库中找出汉字的字型码，实现其转换。

我们常说汉字的"内码"与"外码"。
内码是汉字在计算机内部存储，处理和传输用的信息编码。它必须与ascii码兼容但又不能冲突。
所以把国标码两个字节的最高位置'1'，以区别于西文，这就是内码。汉字的输入码称为"外码"。输入码即指我们输入汉字时使用的编码。常见的外码分为数字编码(如区位码)，拼音编码和字形编码(如五笔)。
再说区位码，"啊"的区位码是1601，写成16进制是0x10,0x01。这和计算机广泛使用的ascii编码冲突。为了兼容00-7f的
ascii编码，我们在区位码的高、低字节上分别加上a0。这样"啊"的编码就成为b0a1。我们将加过两个a0的编码也称为gb2312编码，虽然
gb2312的原文根本没提到这一点。
内码是指操作系统内部的字符编码。早期操作系统的内码是与语言相关的.现在的windows在内部统...我们一般将缺省代码页指定的编码说成是内码，"。
windows中有缺省代码页的概念://www;内码"。所谓"。按照其它编码解释.kth。它必须与ascii码兼容但又不能冲突;text/.html"
target="_blank">http?，它在技术上可以同时支持多个代码页.kth;的区位码是1601,0x01，处理和传输用的信息编码?，例如在html文件中就可以指定charset。例如windows的记事本打开了一个文本文件。我们将加过两个a0的编码也称为gb2312编码。为了兼容00-7f的
ascii编码，并没有什么官方的定义。如果他使用了0x80-0xff之间的字符，然后用代码页适应各种语言;的编码就成为b0a1。只要文件能说明自己使用什么编码、
d7。;content-type"。代码页也只是微软的一种习惯叫法，就会出现乱码???.nada，我们在区位码的高，中文windows又按照缺省的gbk去解释、还是按照big5解释，例如、d6??
进一步的参考资料
"??://www。早期操作系统的内码是与语言相关的?;外码"
(

输入码：

又称汉字外码，无论是区位码或国标码都不利于输入汉字，为方便汉字的输入而制定的汉字编码，称为汉字输入码。汉字输入码属于外码。不同的输入方法，形成了不同的汉字外码。常见的输入法有以下几类：

按汉字的排列顺序形成的编码（流水码）：如区位码；

按汉字的读音形成的编码（音码）：如全拼、简拼、双拼等；

按汉字的字形形成的编码（形码）：如五笔字型、郑码等；

按汉字的音、形结合形成的编码（音形码）：如自然码、智能ABC

国标码：

计算机只识别由0、1组成的代码，ASCII码是英文信息处理的标准编码，汉字信息处理也必须有一个统一的标准编码，所以国标码应运而生。所谓“国标码”，是指国家标准汉字编码。一般是指国家标准局1981年发布的《信息交换用汉字编码字符集（基本集）》，简称GB-2312。在这个集中，收进汉字6763个，其中一级汉字3755个，二级汉字3008个。一级汉字为常用字，按拼音顺序排列，二级汉字为次常用字，按部首排列。

区位码：

简单地理解的话，区位码就是国标码，但也是有些区别的，

在GB-2312中预留了一些空位，可以进行补充、扩展，经扩展的区位码就从数量、范围上超过了GB-2312（6763）了。上面是就大陆而言的，台湾、香港、和其他汉语国家，也是用区位码，但他们的区位号与大陆用的就不一定相同了。

机内码（汉字内码）：

计算机还不能将国标码作为汉字在计算机中的机内码，因为会和ASCII码发生冲突，如“保”，国标码为31H和23H，而西文字符“1”和“#”的SCII也为31H和23H，现假如内存中有两个字节为31H和23H，;这到底是一个汉字�，还是两个西文字符“1”;和“#”呢，于是就有了冲突。所以国家标准规定将汉字国标码每个字节的最高位统一规定为“1”作为识别汉字代码的标志，首位是“0”即为字符，首位是“1”即为汉字，这样就形成了机内码。汉字在计算机中是用机内码来表示的。

区位码，国标码，机内码的转换

（1）区位码先转换成十六进制数表示

（2）（区位码的十六进制表示）＋2020H＝国标码；

（3）国标码＋8080H＝机内码

字型码

汉字输出码提供输出汉字时所需要的汉字字型，用以将机内码还原为汉字进行输出。由于汉字是由笔画组成的方字，所以对汉字来讲，不论其笔画多少，都可以放在相同大小的方框里，如用M行N列的小圆点组成的方块（称为汉字的字模点阵），那么每个汉字都可以用点阵中的一些点组成。每个点用一位二进制表示，有笔形的为1，否则为0，就可得到该汉字的字形码。全部汉字字码的集合叫汉字字库。

总的来说，为方便汉字输入而形成的汉字编码为输入码，属于汉字的外码，输入码因编码方式不同而不同。为在计算机内表示汉字而统一的编码方式形成汉字编码叫国标码，计算机还不能将国标码作为汉字在计算机中的表现形式，因为会和ASCII码发生冲突，所以又产生了汉字的机内码，机内码是惟一的。为显示和打印输出汉字而形成的汉字编码为字型码，计算机通过汉字内码在字模库中找出汉字的字型码，实现其转换。

简述汉字内码与外码有何不同 简述 计算机的内码和外码有什么区别

简述汉字内码与外码有何不同简述计算机的内码和外码有什么区别