Unicode转汉字问题

bluejoy345 2010-03-31 08:34:56
请问如何将一个Unicode字符串转换为汉字。如,输入\u4e2d,输出中。
我说的并不是一般的直接赋值String str = "\u4e2d";
而是在编译之后赋值,比如说读一个txt文件,文件内容是\u4e2d,如何将这个文件中的字符串在控制台输出中文。
我查过了,好像java是在编译的时候自动将Unicode码转化的,现在怎么在运行中转化,请教
...全文
2130 12 打赏 收藏 转发到动态 举报
写回复
用AI写文章
12 条回复
切换为时间正序
请发表友善的回复…
发表回复
tdgwj 2010-04-01
  • 打赏
  • 举报
回复
String str = "Unicode码";
char[]c=str.toCharArray();
System.out.println(new String(c));

……嘎嘎。。貌似很简单的说。。
py330316117 2010-04-01
  • 打赏
  • 举报
回复
lz的意思是自己写一个代码转换的方法
若鱼1919 2010-04-01
  • 打赏
  • 举报
回复
我弄了一个按行解析unicode的方法,你可以试一下:

public static String parseUnicode(String line){
int len=line.length();
char[] out=new char[len];//保存解析以后的结果
int outLen=0;
for(int i=0;i<len;i++){
char aChar=line.charAt(i);
if(aChar=='\\'){
aChar=line.charAt(++i);
if(aChar=='u'){
int value=0;
for(int j=0;j<4;j++){
aChar=line.charAt(++i);
switch (aChar) {
case '0': case '1': case '2': case '3': case '4':
case '5': case '6': case '7': case '8': case '9':
value = (value << 4) + aChar - '0';
break;
case 'a': case 'b': case 'c':
case 'd': case 'e': case 'f':
value = (value << 4) + 10 + aChar - 'a';
break;
case 'A': case 'B': case 'C':
case 'D': case 'E': case 'F':
value = (value << 4) + 10 + aChar - 'A';
break;
default: throw new IllegalArgumentException("Malformed \\uxxxx encoding.");
}
}
out[outLen++]=(char)value;
}else{
if (aChar == 't') aChar = '\t';
else if (aChar == 'r') aChar = '\r';
else if (aChar == 'n') aChar = '\n';
else if (aChar == 'f') aChar = '\f';
out[outLen++] = aChar;
}
}else{
out[outLen++] = aChar;
}
}
return new String (out, 0, outLen);
}
//调用的时候:
public static void main(String rags[])throws Exception{
BufferedReader br=new BufferedReader(new InputStreamReader(new FileInputStream("1.txt")));
String line="";
while((line=br.readLine())!=null){
System.out.println(parseUnicode(line));
}
br.close();

}
bluejoy345 2010-04-01
  • 打赏
  • 举报
回复
[Quote=引用 7 楼 goldenfish1919 的回复:]
http://topic.csdn.net/u/20100328/00/e58659ae-5923-4216-b27d-abc2c509a825.html
[/Quote]

已经可以弄出来了。还是还有一点问题
public static String loadConvert (char[] in, int off, int len, char[] convtBuf)

请问len,convtBuf怎么指定啊,我的是未知的Unicode。
若鱼1919 2010-04-01
  • 打赏
  • 举报
回复
http://topic.csdn.net/u/20100328/00/e58659ae-5923-4216-b27d-abc2c509a825.html
bluejoy345 2010-04-01
  • 打赏
  • 举报
回复
[Quote=引用 3 楼 py330316117 的回复:]
只要的你的ide默认的编码方式是utf-8就能直接像#2那么转换,但是涉及到国际化的问题时,你必须把你的所有字符转换成unicode码
[/Quote]


我直接输入二楼那样的String str = "\u4e2d“ 是可以输出中文的,这已经经过编译了,我需要的是运行中吧unicode转换成汉字。
bluejoy345 2010-04-01
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 tdgwj 的回复:]
String str = "Unicode码";
char[]c=str.toCharArray();
System.out.println(new String(c));

……嘎嘎。。貌似很简单的说。。
[/Quote]

当 String str = "Unicode码"; 的时候,编译器就已经把Unicode自动转换了,你可以输出str.length()看看,而我说的字符串,输出的是转换前的长度。
Ark032425 2010-04-01
  • 打赏
  • 举报
回复
[Quote=引用 3 楼 py330316117 的回复:]
只要的你的ide默认的编码方式是utf-8就能直接像#2那么转换,但是涉及到国际化的问题时,你必须把你的所有字符转换成unicode码
[/Quote]
赞同
py330316117 2010-04-01
  • 打赏
  • 举报
回复
只要的你的ide默认的编码方式是utf-8就能直接像#2那么转换,但是涉及到国际化的问题时,你必须把你的所有字符转换成unicode码
bluejoy345 2010-04-01
  • 打赏
  • 举报
回复
谢谢9楼大哥,已经解决问题。
bluejoy345 2010-04-01
  • 打赏
  • 举报
回复
[Quote=引用 10 楼 py330316117 的回复:]
lz的意思是自己写一个代码转换的方法
[/Quote]

不是要自己写,可能你没明白我的意思。能找到现成的类自然好了。是实在找不到解决的办法了,只有自己写了。
qqbz 2010-03-31
  • 打赏
  • 举报
回复
有对字符编码的类,具体方法忘记了。

62,616

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧