[[[如何得知一个网页的编码]]]?
自己编写的程序,下载网页,但是下回来的网页有些是正常的,有些中文部分是乱码。 我猜测应该是编码的问题,非gb2312的编码,显示的是乱码,我在网上找到了编码转换的函数,但是,我不清楚我下回来的网页是什么编码,我也就不能随便转换,所以想向各位请教,如何得知一个网页是何种编码?
感谢!!!
问题点数:100、回复次数:4Top
1 楼MapleInHG()回复于 2006-03-04 11:20:38 得分 0
网页源文件中的<head>里面有一个charset指定了编码,比如charset=gb2312Top
2 楼freespider()回复于 2006-03-05 10:49:57 得分 0
回复:MapleInHG()
这点我已经测试过,有些网页并没有这个charset设置,据我猜测如果没有charset设置,那么应该有个默认编码,但是我取回来的网页,有的是utf8的,有的是gb2312的,而这些网页都没有charset设置。也就是说,我上面的猜测不成立。Top
3 楼MapleInHG()回复于 2006-03-05 17:26:21 得分 100
那是网页设计者的失误,不是你的错,你只能尽可能去猜测,你难道没发现IE有时候也弄错编码吗?Top
4 楼freespider()回复于 2006-03-05 19:25:34 得分 0
呵呵,谢谢Top




