感悟网 导航

内码和外码分别是什么啊? 什么是汉字的内码、外码、交换码、字形码?

作者&投稿:仲孙耍 (若有异议请与网页底部的电邮联系)
计算机的内码和外码有什么区别~

我们常说汉字的"内码"与"外码"。
内码是汉字在计算机内部存储,处理和传输用的信息编码。它必须与ascii码兼容但又不能冲突。
所以把国标码两个字节的最高位置'1',以区别于西文,这就是内码。汉字的输入码称为"外码"。输入码即指我们输入汉字时使用的编码。常见的外码分为数字编码(如区位码),拼音编码和字形编码(如五笔)。
再说区位码,"啊"的区位码是1601,写成16进制是0x10,0x01。这和计算机广泛使用的ascii编码冲突。为了兼容00-7f的
ascii编码,我们在区位码的高、低字节上分别加上a0。这样"啊"的编码就成为b0a1。我们将加过两个a0的编码也称为gb2312编码,虽然
gb2312的原文根本没提到这一点。
内码是指操作系统内部的字符编码。早期操作系统的内码是与语言相关的.现在的windows在内部统...我们一般将缺省代码页指定的编码说成是内码,"。
windows中有缺省代码页的概念://www;内码"。所谓"。按照其它编码解释.kth。它必须与ascii码兼容但又不能冲突;text/.html"
target="_blank">http?,它在技术上可以同时支持多个代码页.kth;的区位码是1601,0x01,处理和传输用的信息编码?,例如在html文件中就可以指定charset。例如windows的记事本打开了一个文本文件。我们将加过两个a0的编码也称为gb2312编码。为了兼容00-7f的
ascii编码,并没有什么官方的定义。如果他使用了0x80-0xff之间的字符,然后用代码页适应各种语言;的编码就成为b0a1。只要文件能说明自己使用什么编码、
d7。;content-type"。代码页也只是微软的一种习惯叫法,就会出现乱码???.nada,我们在区位码的高,中文windows又按照缺省的gbk去解释、还是按照big5解释,例如、d6??
进一步的参考资料
"??://www。早期操作系统的内码是与语言相关的?;外码"
(

1、内码是指计算机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码,通过内码可以达到通用和高效率传输文本的目的。如ASCII。
2、外码是相对于内码而言的辞汇。在计算机科学及相关领域中,外码指的是“外在的‘经过学习之后,可直接了解的编码形式(例如:文字或语音符号)’”。
中文输入法对汉字的编码即属外码。常见的中文外码有仓颉码、行列码、大易码、呒虾米码、注音码、拼音码。
3、交换码是指用于交换文件所使用的编码。对于计算机而言,不同的系统有可能使用不同的内码。但如果不同系统间要交换文件,则会发生乱码现象。解决方法则为,在交换文件前,文件提供者先将由内码形式储存的文件转换成交换码形式再做交换。在接收文件后,文件接收者再由交换码转成内码。
4、字形码,点阵代码的一种。为了将汉字在显示器或打印机上输出,把汉字按图形符号设计成点阵图,就得到了相应的点阵代码(字形码)。用于显示的字库叫显示字库。显示一个汉字一般采用16×16点阵或24×24点阵或48×48点阵。已知汉字点阵的大小,可以计算出存储一个汉字所需占用的字节空间。

5、汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。

参考资料来源:百度百科-汉字机内码
参考资料来源:百度百科-内码
参考资料来源:百度百科-外码
参考资料来源:百度百科-交换码
参考资料来源:百度百科-字形码

一、内码是指计算机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码,通过内码可以达到通用和高效率传输文本的目的。

二、外码

外码是相对于内码而言的辞汇。在计算机科学及相关领域中,外码指的是“外在的‘经过学习之后,可直接了解的编码形式(例如:文字或语音符号)

中文输入法对汉字的编码即属外码。常见的中文外码有仓颉码、行列码、大易码、呒虾米码、注音码、拼音码。

扩展资料:

内码的分类

1、字符编码:字符编码就是以二进制的数字来对应字符集的字符,用得最普遍的字符集是ANSI,对应ANSI字符集的二进制编码就称为ANSI码,DOS和Windows系统都使用了ANSI码,但在系统中使用的字符编码要经过二进制转换,称为系统内码。

2、汉字内码:ANSI码是单一字节(8位二进制数)的编码集,最多只能表示256个字符,不能表示众多的汉字字符,各个国家和地区在ANSI码的基础上又设计了各种不同的汉字编码集,以能够处理大数量的汉字字符。

这些编码使用单字节来表示ANSI的英文字符(即兼容ANSI码),使用双字节来表示汉字字符。由于一个系统中只能有一种汉字内码,不能识别其它汉字内码的字符,造成了交流的不便。

3、GB码:GB码是1980年国家公布的简体汉字编码方案,在大陆、新加坡得到广泛的使用,也称国标码。国标码对6763个汉字集进行了编码,涵盖了大多数正在使用的汉字。

4、GBK码:GBK码是GB码的扩展字符编码,对多达2万多的简繁汉字进行了编码,简体版的Win95和Win98都是使用GBK作系统内码。

5、BIG5码:BIG5码是针对繁体汉字的汉字编码,在台湾、香港的电脑系统中得到普遍应用。

6、HZ码:HZ码是在Internet上广泛使用的一种汉字编码。

7、ISO-2022CJK码:ISO-2022是国际标准组织(ISO)为各种语言字符制定的编码标准。采用二个字节编码,其中汉语编码称ISO-2022 CN,日语、韩语的编码分别称JP、KR。一般将三者合称CJK码。CJK码主要在Internet网络中使用。

8、Unicode码:Unicode码也是一种国际标准编码,采用二个字节编码,与ANSI码不兼容。在网络、Windows系统和很多大型软件中得到应用。

参考资料:百度百科_内码

百度百科_外码



  我们常说汉字的"内码"与"外码"。

  内码是汉字在计算机内部存储,处理和传输用的信息编码。它必须与ASCII码兼容但又不能冲突。

  所以把国标码两个字节的最高位置'1',以区别于西文,这就是内码。汉字的输入码称为"外码"。输入码即指我们输入汉字时使用的编码。常见的外码分为数字编码(如区位码),拼音编码和字形编码(如五笔)。

  再说区位码,"啊"的区位码是1601,写成16进制是0x10,0x01。这和计算机广泛使用的ASCII编码冲突。为了兼容00-7f的 ASCII编码,我们在区位码的高、低字节上分别加上A0。这样"啊"的编码就成为B0A1。我们将加过两个A0的编码也称为GB2312编码,虽然 GB2312的原文根本没提到这一点。
  内码是指操作系统内部的字符编码。早期操作系统的内码是与语言相关的.现在的Windows在内部统一使用Unicode,然后用代码页适应各种语言,"内码"的概念就比较模糊了。我们一般将缺省代码页指定的编码说成是内码。内码这个词汇,并没有什么官方的定义。代码页也只是微软的一种习惯叫法。作为程序员,我们只要知道它们是什么东西,没有必要过多地考证这些名词。
  所谓代码页(code page)就是针对一种语言文字的字符编码。例如GBK的code page是CP936,BIG5的code page是CP950,GB2312的code page是CP20936。
  Windows中有缺省代码页的概念,即缺省用什么编码来解释字符。例如Windows的记事本打开了一个文本文件,里面的内容是字节流:BA、BA、 D7、D6。Windows应该去怎么解释它呢?是按照Unicode编码解释、还是按照GBK解释、还是按照BIG5解释,还是按照ISO8859-1 去解释?如果按GBK去解释,就会得到"汉字"两个字。按照其它编码解释,可能找不到对应的字符,也可能找到错误的字符。所谓"错误"是指与文本作者的本意不符,这时就产生了乱码。
  答案是Windows按照当前的缺省代码页去解释文本文件里的字节流。缺省代码页可以通过控制面板的区域选项设置。记事本的另存为中有一项ANSI,其实就是按照缺省代码页的编码方法保存。
  Windows的内码是Unicode,它在技术上可以同时支持多个代码页。只要文件能说明自己使用什么编码,用户又安装了对应的代码页,Windows就能正确显示,例如在HTML文件中就可以指定charset。
  有的HTML文件作者,特别是英文作者,认为世界上所有人都使用英文,在文件中不指定charset。如果他使用了0x80-0xff之间的字符,中文Windows又按照缺省的GBK去解释,就会出现乱码。这时只要在这个html文件中加上指定charset的语句,例如:
  <meta http-equiv="Content-Type" content="text/html; charset=ISO8859-1">
  如果原作者使用的代码页和ISO8859-1兼容,就不会出现乱码了。????????????????????????
  进一步的参考资料
  "Short overview of ISO-IEC 10646 and Unicode" (http://www.nada.kth.se/i18n/ucs/unicode-iso10646-oview.html)

《什么是内码和外码?》
答:内码是汉字在计算机内部存储,处理和传输用的信息编码。它必须与ASCII码兼容但又不能冲突。所以把国标码两个字节的最高位置'1',以区别于西文,这就是内码。汉字的输入码称为"外码"。输入码即指我们输入汉字时使用的编码。常见的外码分为数字编码(如区位码),拼音编码和字形编码(如五笔)。再说区位码...

《内码和外码分别是什么啊?》
答:一、内码是指计算机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码,通过内码可以达到通用和高效率传输文本的目的。二、外码 外码是相对于内码而言的辞汇。在计算机科学及相关领域中,外码指的是“外在的‘经过学习之后,可直接了解的编码形式(例如:文字或语音符号)中文输入法...

《内码和外码分别是什么啊》
答:内码是指计算机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码,通过内码可以达到通用和高效率传输文本的目的,分为字符编码、汉字内码、国标码等多种类型。外码是相对于内码而言的辞汇。在计算机科学及相关领域中,外码指的是外在的经过学习之后,可直接了解的编码形式(例如:文...

《什么是内码,什么是外码?》
答:2、外码:也叫输入码,是用来将汉字输入到计算机中的一组键盘符号。英文字母只有26个,可以把所有的字符都放到键盘上,而使用这种办法把所有的汉字都放到键盘上,是不可能的。所以汉字系统需要有自己的输入码体系,使汉字与键盘能建立对应关系。3、交换码:计算机内部处理的信息,都是用二进制代码表示的...

《什么是内码和外码?》
答:1、性质不同 内码是指计算机系统中的编码;外码是指可以直接了解学习的编码。2、分类不同 内码有字符编码、汉字内码、GB码、GBK码、BIG5码、HZ码、ISO-2022CJK码、Unicode码;外码有仓颉码、行列码、大易码、呒虾米码、注音码、拼音码。

《什么是汉字的内码、外码、交换码、字形码?》
答:1、内码是指计算机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码,通过内码可以达到通用和高效率传输文本的目的。如ASCII。2、外码是相对于内码而言的辞汇。在计算机科学及相关领域中,外码指的是“外在的‘经过学习之后,可直接了解的编码形式(例如:文字或语音符号)’”。...

《在汉字编码中,什么是外码、内码、国标码,他们之间的关系如何》
答:外码就是输入的时候用的(比如你输入拼音,或者输入全拼,或者五笔,要按的键就是外码)内码是二进制编码(两个asc2字符=一个中文字符)国际码是中文的编码格式,比如Gb2312 外码是输入文字的时候要用到的 内码和国际码之间可以互相转换

《什么是汉字的内码、外码、交换码、字形码?》
答:内码:指机内码,指计算机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码。外码:指输入码,是用来将汉字输入到计算机中的一组键盘符号。常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等 。交换码:指用于交换文件所使用的编码。字形码:是汉字...

《外码和内码的区别》
答:1、含义不同:内码是指计算机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码,而外码是相对于内码而言的辞汇,在计算机科学及相关领域中常用。2、作用不同:通过内码可以达到通用和高效率传输文本的目的,而外码可以“外在的‘经过学习之后,可直接了解的编码形式(例如文字或语音...

《汉字的四种主要编码为》
答:1、外码 外码是用来将汉字输入到计算机中的一组键盘符号。常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等。2、交换码 交换码计算机内部处理信息,用二进制代码表,需要采用信息交换码。3、机内码 机内码根据国标码的规定,每一个汉字都有了确定的二进制代码,在微机...

   

返回顶部
本页内容来自于网友发表,若有相关事宜请照下面的电邮联系
感悟网