GBK和unicode编码方式各是什么??具体一点,就这些分了,都给了
rt 问题点数:0、回复次数:10Top
1 楼little_paradise()回复于 2005-03-04 08:20:41 得分 0
你可以google一下啊,网上很多资料dTop
2 楼agamem(O-Money)回复于 2005-03-04 08:51:31 得分 0
GBK的介绍:
http://www.haiyan.com/steelk/navigator/ref/gbk/gbindex.htm
UNICODE:
不用找GBK与Unicode的对应规律,他们是没有规律的,只是简单的根据码表对应!Top
3 楼kaniggia(每天多学一点)回复于 2005-03-04 08:54:01 得分 0
GBK
该编码标准为双字节编码,GB2312-80的扩充,在码位上和GB2312-80兼容,共收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库。其第一字节的值在 16 进制的 81~FE 之间,第二字节在 40~FE,除去xx7F一线。共23940个码位。
Top
4 楼kaniggia(每天多学一点)回复于 2005-03-04 08:54:29 得分 0
查找GBK字库的资料得知:GBK码表,共126个区,每区190个汉字。而且其第一字节的值在 81~FE 之间,第二字节在 40~FE,除去xx7F一线。也就是说,区码在81~FE之间,对每一区而言,位码在40~FE之间。
则汉字偏移量的计算如下:
假定:
区码:kQu
位码:kWei
每个汉字的字节数:n
则posit = (((U16)(kQu-0x81))*190 +(U16)(kWei-((kWei>0x7f)?0x41:0x40)))*n;
Top
5 楼kaniggia(每天多学一点)回复于 2005-03-04 08:56:06 得分 0
由于每种语言都制定了自己的字符集,导致最后存在的各种字符集实在太多,在国际交流中要经常转换字符集非常不便。因此,产生了Unicode字符集,它固定使用16 bits(两个字节)来表示一个字符,共可以表示65536个字符
标准的Unicode称为UTF-16(UTF:UCS Transformation Format )。后来为了双字节的Unicode能够在现存的处理单字节的系统上正确传输,出现了UTF-8,使用类似MBCS的方式对Unicode进行编码。(Unicode字符集有多种编码形式)
Top
6 楼dongpy(51-->ARM)回复于 2005-03-04 09:10:00 得分 0
网上这方面资料很多的,找些看看,比这里得到的详细。
包含多国语言的软件都用unicode。Top
7 楼hxblvc(还是好好学吧...)回复于 2005-03-04 09:16:20 得分 0
UPTop
8 楼dongpy(51-->ARM)回复于 2005-03-04 09:16:30 得分 0
看看这个:http://www-900.ibm.com/developerworks/cn/linux/i18n/unicode/linuni/index.shtmlTop
9 楼kof_sdu(虫族男孩)回复于 2005-03-04 10:37:17 得分 0
如果是在作Web的时候 那么应当注意一下 各个页面的Content-page下的charset应该统一,否则容易出现乱码 ,特别是从数据库读取数据后在页面显示的时候。可以统一用GBK,也可以用UTF-8
另外 Unicode对应UTF-8Top
10 楼Kelvin_Chen()回复于 2005-03-10 14:59:44 得分 0
顶
Top




