求助高手:有关日文字符的问题!!急~~~~
我想实现:从日文网页中截取所需的内容。我操作过程:下载网页到本地,然后读源码,找到相应的内容,保存到记事本中。以上是做英文的内容的,没有问题。但是,现在日文网页,下载到本地后,源码中日文部分都成乱码了,就是截取到记事本上,也是乱码。
网页内容:
著者からのコメント
本書は教科書なので,ヒューマノイドロボットの歴史と概要をのべた第1章を除くと一般の方には少々ハードルの高い内容です.数式はベクトル,行列,三角関数,微分方程式とフルコースで登場します.一応理系出身の某女性に読ませたところ第2章の3ページ目で音を上げました(笑).それでも,ここに書かれているのはHRP-2を実際に動かしている技術ですから.たとえ理解はできなくとも,SFやアニメとは違う現実のロボット研究の雰囲気を感じていただけると思います.
逆にある分野の専門家(例えばコンピュータグラフィックス)の方には,意外と易しく読めるはずです.「何だ,ロボットの世界ではこの程度の問題で悩んでいるのか」と思われた方にはぜひヒューマノイドロボットの研究に参入してほしい,それが本書を世に出した我々のもう一つの狙いです.
提取出来的结果:
丂杮彂偼嫵壢彂側偺偱丆僸儏乕儅僲僀僪儘儃僢僩偺楌巎偲奣梫傪偺傋偨戞侾復傪彍偔偲堦斒偺曽偵偼彮乆僴乕僪儖偺崅偄撪梕偱偡丏悢幃偼儀僋僩儖丆峴楍丆嶰妏娭悢丆旝暘曽掱幃偲僼儖僐乕僗偱搊応偟傑偡丏堦墳棟宯弌恎偺朸彈惈偵撉傑偣偨偲偙傠戞俀復偺3儁乕僕栚偱壒傪忋偘傑偟偨乮徫乯丏偦傟偱傕丆偙偙偵彂偐傟偰偄傞偺偼HRP-2傪幚嵺偵摦偐偟偰偄傞媄弍偱偡偐傜丏偨偲偊棟夝偼偱偒側偔偲傕丆SF傗傾僯儊偲偼堘偆尰幚偺儘儃僢僩尋媶偺暤埻婥傪姶偠偰偄偨偩偗傞偲巚偄傑偡丏<BR>丂媡偵偁傞暘栰偺愱栧壠乮椺偊偽僐儞僺儏乕僞僌儔僼傿僢僋僗乯偺曽偵偼丆堄奜偲堈偟偔撉傔傞偼偢偱偡丏乽壗偩丆儘儃僢僩偺悽奅偱偼偙偺掱搙偺栤戣偱擸傫偱偄傞偺偐乿偲巚傢傟偨曽偵偼偤傂僸儏乕儅僲僀僪儘儃僢僩偺尋媶偵嶲擖偟偰傎偟偄丆偦傟偑杮彂傪悽偵弌偟偨変乆偺傕偆堦偮偺慱偄偱偡丏.
请教,如何解决这个问题,拜托了,分不够再加!!!
问题点数:100、回复次数:11Top
1 楼DooDu(杜霖:I want,I can(开关拉))回复于 2005-06-03 11:07:04 得分 0
你是如何取的?Top
2 楼hot1kang1(网站制作,系统开发,记得-http://3q2008.Com)回复于 2005-06-03 11:12:34 得分 0
编码格式的原因 原来页面时日文的编码格式或是utf8 的格式
我也遇到了我的库库中是GB2312的格式 我到UTF8里就出错了正在找解决办法Top
3 楼supergreenbean(超级绿豆(MSMVP - VB) - 升级归来~)回复于 2005-06-03 11:29:41 得分 90
Private Declare Function MultiByteToWideChar Lib "kernel32" (ByVal CodePage As Long, ByVal dwFlags As Long, lpMultiByteStr As Any, ByVal cchMultiByte As Long, lpWideCharStr As Any, ByVal cchWideChar As Long) As Long
Private Sub Form_Load()
Dim s As String
s = "丂杮彂偼嫵壢彂側偺偱丆僸儏乕儅僲僀僪儘儃僢僩偺楌巎偲奣梫傪偺傋偨戞侾復傪彍偔偲堦斒偺曽偵偼彮乆僴乕僪儖偺崅偄撪梕偱偡丏悢幃偼儀僋僩儖丆峴楍丆嶰妏娭悢丆旝暘曽掱幃偲僼儖僐乕僗偱搊応偟傑偡丏堦墳棟宯弌恎偺朸彈惈偵撉傑偣偨偲偙傠戞俀復偺3儁乕僕栚偱壒傪忋偘傑偟偨乮徫乯丏偦傟偱傕丆偙偙偵彂偐傟偰偄傞偺偼HRP-2傪幚嵺偵摦偐偟偰偄傞媄弍偱偡偐傜丏偨偲偊棟夝偼偱偒側偔偲傕丆SF傗傾僯儊偲偼堘偆尰幚偺儘儃僢僩尋媶偺暤埻婥傪姶偠偰偄偨偩偗傞偲巚偄傑偡丏<BR>丂媡偵偁傞暘栰偺愱栧壠乮椺偊偽僐儞僺儏乕僞僌儔僼傿僢僋僗乯偺曽偵偼丆堄奜偲堈偟偔撉傔傞偼偢偱偡丏乽壗偩丆儘儃僢僩偺悽奅偱偼偙偺掱搙偺栤戣偱擸傫偱偄傞偺偐乿偲巚傢傟偨曽偵偼偤傂僸儏乕儅僲僀僪儘儃僢僩偺尋媶偵嶲擖偟偰傎偟偄丆偦傟偑杮彂傪悽偵弌偟偨変乆偺傕偆堦偮偺慱偄偱偡丏."
Debug.Print Fn(s)
End Sub
Function Fn(ByVal sIn As String) As String
Dim lLen As Long
lLen = MultiByteToWideChar(932, 0, ByVal sIn, -1, ByVal 0, 0)
Fn = Space$(lLen - 1)
Call MultiByteToWideChar(932, 0, ByVal sIn, -1, ByVal StrPtr(Fn), lLen)
End FunctionTop
4 楼boyalsogood()回复于 2005-06-03 11:54:30 得分 0
to:supergreenbean(超级绿豆 - 要准备发芽了)
原理没看懂,但是已经实现我的想法,谢谢!如果你能再帮忙解释一下就好了!我会再开帖子的,请帮忙解释一下吧,谢谢!Top
5 楼supergreenbean(超级绿豆(MSMVP - VB) - 升级归来~)回复于 2005-06-03 12:20:31 得分 10
就是用MultiByteToWideChar根据日文代码页(=932)把上面一大坨的东西映射为偶们看得懂的Unicode字符Top
6 楼boyalsogood()回复于 2005-06-03 12:30:15 得分 0
那要是网页是俄文或德文的呢?改哪个参数呢?
Top
7 楼supergreenbean(超级绿豆(MSMVP - VB) - 升级归来~)回复于 2005-06-04 08:14:45 得分 0
把第1个参数改成相应语言的代码页号应该可以,呵呵Top
8 楼boyalsogood()回复于 2005-06-05 14:21:24 得分 0
可否给一份简单的代码表呢??比如德文、俄文和法文的,谢谢了Top
9 楼supergreenbean(超级绿豆(MSMVP - VB) - 升级归来~)回复于 2005-06-05 23:39:59 得分 0
msdn里面有的啊,在international features这节
mk:@MSITStore:C:\Program%20Files\Microsoft%20Visual%20Studio\MSDN\2000JUL\1033\intl.chm::/hh/winbase/unicode_3ipf.htmTop
10 楼boyalsogood()回复于 2005-06-06 10:02:37 得分 0
ok 谢谢绿豆先生 :)
结帖了!Top
11 楼crycoming(瞎编)回复于 2005-06-10 18:37:25 得分 0
我用其他方法解决这个问题的,但是utf8和unicode不能完全映射,会遇到某些字符还是乱码的现象
不知道搂主是否遇到这个问题?Top




