历史上的今天
今天是:2025年04月19日(星期六)
2019年04月19日 | 汉字编码及显示原理总结
2019-04-19 来源:eefocus
一·显示过程:
键盘敲击 产生 > 外码 转换 >机内码 查 找 >字库(输出码) 显示 >屏幕
①外码
汉字输入码(外码)是指用户从键盘上键入汉字时所使用的汉字编码。
例如:
数字编码:区位码;
拼音编码:全拼、双拼、微软拼音输入法、自然码、智能ABC、搜狗等
字形编码:五笔、表形码、郑码输入法等。
②汉字机内码 :
汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工
和传输汉字时所用的由0和1符号组成的代码。外码到汉字机内码不是直接转换
的 如汉字区位码转换位汉字机内码 :区位码先转换为国标码(GB2312)
(其实国标码就是十六进制的区位码) 汉字机内码=国标码+8080H ;
我认为国标码就相当于一种中间码,为什么国标码要加8080H才是汉字机内码呢?
这个是为了兼容 ASCII 码而设定的,我们知道 ASCII 码一共有 127 个,也就是从
0x00~0x77F[ASCII的最高位都为0]。加上0x80是为了使得每个字节的最高位为1,
这样就可以在内存中区分汉字和ASCII了。
③字库(输出码)
字库(输出码):文字在 屏幕 上面显示,其实也就是在一定范围内显示一些点,
不显示一
些点,从而构成一个文字显示出来,而我们的字库其实也就是存储这些文字的点阵
数据 。国标码对应的 点阵数据存储的顺序就是按照区位码顺序存储的:所有的国
标码汉字及符
号组成一个94行94列的二维代码表(字库)。在此方阵中,每一行称为一个"区",
每一列称为一个"位"。这个方阵实际上组成一个有94个区(编号由01到94),每个
区有94个位(编号由01到94)的汉字字符集。每个字节分别用两位十进制编码,前
字节的编码称为区码,后字节的编码称为位码,此即区位码,其中,高两位为区号,
低两位为位号。这样区位码可以唯一地确定某一汉字或字符;反之,任何一个汉字
或符号都对应一个唯一的区位码。(国标码并不等于区位码,它是由区位码稍作转
换得到,其转换方法为:先将十进制区码和位码转换为十六进制的区码和位码)
二·其他:
①汉字编码有好多种除了GB2312(国标码),还有GBK,BIG5,UNICODE等,
② 对于国标码原则上,两个字节可以表示 256×256=65536 种不同的符号,作为
汉字编码表示的基础是可行的。但考虑到汉字编码与其它国际通用编码,如ASCII 西
文字符编码的关系,我国国家标准局采用了加以修正的两字节汉字编码方案,只用了
两个字节的低7位。这个方案可以容纳 128×128=16384 种不同的汉字,但为了与标准
ASCII码兼容,每个字节中都不能再用32个控制功能码和码值为32的空格以及127的操
作码。故每个字节只能有94个编码,所以双七位实际能够表示的字数是:94×94=8836个,
为国际字符集编码标准只和ASCII编码兼容。GB2312一共收录了7445个字符,包括6763个
汉字和682个其它符号。汉字区的内码范围高字节从B0-F7,低字节从A1-FE,占用的码位
是72*94=6768。其中有5个空位是D7FA-D7FE。GB2312支持的汉字太少。1995年的汉字
扩展规范GBK1.0收录了21886个符号,它分为汉字区和图形符号区。汉字区包括21003个
字符。2000年的GB18030是取代GBK1.0的正式国家标准。该标准收录了27484个汉字,
同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。
③Unicode也是一种字符编码方法,不过它是由国际组织设计,可以容纳全世界所有语言
文字的编码方案。
④BIG5是繁体字的编码
史海拾趣
|
有天,一个新工程师问我,做好产品开发最重要的是什么? 这个问题把我问住了,想了好一会,才回答说: 第一:千万不要相信经验,不是因为你的经验不够丰富,而是你面临的问题不可能和经验完全一样,经验还要经过实 ...… 查看全部问答> |
|
为了能在用TI图形库方便些特做了个小工具,且不断一步步增加完善中 9。24 [ 本帖最后由 蓝雨夜 于 2011-9-24 09:13 编辑 ]… 查看全部问答> |
|
小弟在读取spi类flash W25Q128时,发现速度很慢,经测试,只达到300KB/S作用的速度。与要求相差甚远,于是想,是否可用DMA方式来读取,以便速度能提高。 首先说一下SPI与DMA的配置,配置 ...… 查看全部问答> |
|
型号:CM-AM335X基于TI的AM3359处理器,500、600、720MHZ,ARM CORTEX-A8,内存DDR2 1GB,NANDFLASH 256MB. CM-AM335X是莱得科技专门针对工业产品应用做的低成本平台,高达720MHZ的 Cortex-A8处理器能满足各种工业应用。针对工控领域 ...… 查看全部问答> |
|
【连载】【ALIENTEK 战舰STM32开发板】STM32开发指南--第十六章 电容触摸按键实验 第十六章 电容触摸按键实验上一章,我们介绍了STM32的输入捕获功能及其使用。这一章,我们将向大家介绍如何通过输入捕获功能,来做一个电容触摸按键。在本章中,我们将用TIM5的通道2(PA1)来做输入捕获,并实现一个简单的电容触摸按键,通过该按键 ...… 查看全部问答> |
|
replyreload += \',\' + 1562052;本书是模拟设计领域牛人经验的浓缩,总结了100个问题,下载: Timson,如果您要查看本帖隐藏内容请回复… 查看全部问答> |
|
出一些板子和其他东西,430,51,stm32,tiva等等 本帖最后由 flashtt 于 2015-9-3 21:20 编辑 电赛结束了,我的大四也即将开始,清算一下以前的东西,存货挺多,先出一些板子和其他东西,晚上再上图 1.参加”蓝桥杯“省一的奖品,一个乐迈R9030蓝牙耳机,原价130左右,对我没什么用,我可是交了 ...… 查看全部问答> |
|
EEWORLD大学堂----2015 TI 音频创新日 (3) 面向 BT 扬声器 / WIFI 的音频解决方案与完整的参考设计 2015 TI 音频创新日 (3) 面向 BT 扬声器 / WIFI 的音频解决方案与完整的参考设计:https://training.eeworld.com.cn/course/2229… 查看全部问答> |
|
Simulating the front-end of your ADC - 仿真 ADC 的前端 转自deyisupport 作者:Bonnie Baker逐次逼近、模数转换器 (SAR-ADC) 很简单直接,用户将模拟电压接在输入端上 (AINP, AINN, REF),会看到一个输出数字代码,这个代码表示相对于基准的模拟输入电压。此时,用户也许很想分析一下转换器的技术规格, ...… 查看全部问答> |




