如何读取中英文混合的文件?(60分!!!!!!!!!!!!!!!!!)
请教大侠们,我现在想对一篇中英文混合的文章进行逐个字符的读取应该怎么处理?
比如 这篇文章由以下的内容组成 “... ... John 是一个好同志 ......”。
对于汉字和英文占用不同的字节的问题,应该如何处理?
(本人比较弱,以前没有处理过中英文混排的问题)
最好能举个例子.
60分呀!!!!!!!!!!!!!!!!!!!!!!!!!!!!11
多谢!!!!!!!!!!!!!!!!!!!!
问题点数:60、回复次数:7Top
1 楼zhimajie(芝麻街)回复于 2001-10-10 19:03:15 得分 0
GZTop
2 楼a813(周)回复于 2001-10-10 21:23:24 得分 0
中文采用双字节,英文单字节ASCII码(只用7位,首位为0),而中文的首位为(1).
可以采用步骤为
1.读入双字节,判断高位的bit7是否为1,如是则为中文,不是则双字节为ASCII字符.
仅供参考.
Top
3 楼zhimajie(芝麻街)回复于 2001-10-10 21:53:55 得分 0
谢谢 a813(周) 大侠
请问如果存储一个汉字的话要用什么类型的数据结构?
char 型是不是不够呀?Top
4 楼a813(周)回复于 2001-10-10 22:04:49 得分 0
CString, char都可以,只不过都是占用2个byte。所以预留的空间要大Top
5 楼MSVCer(家宝)回复于 2001-10-10 22:39:21 得分 60
http://www.csdn.net/expert/topic/298/298102.shtm
看我的回答Top
6 楼zhimajie(芝麻街)回复于 2001-10-21 20:09:43 得分 0
谢谢你 家宝 我已经把分加好了Top
7 楼MSVCer(家宝)回复于 2001-10-21 22:24:16 得分 0
谢谢,分就让它这么去吧Top




