一个高难度的问题,在抓取网页时,如何获得javascript执行后的内容?
由于现在有不少网页采用了javascript技术,因此在抓取网页的时候,只能抓取这些源代码,但是无法得到javascript执行后的内容,有没有什么办法能够模拟执行javascript并得到执行后的内容。这个问题很有难度,但是有人实现了的,不知道CSDN上有没有高手知道如何解决这个问题?非常感谢!
http://64.233.179.104/search?q=cache:mefZzT34xXMJ:affair.gzgo.gov.cn/govaffair/upload/SearchFull%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E%E7%99%BD%E7%9A%AE%E4%B9%A6.doc+%E6%8A%93%E5%8F%96javascript%E6%89%A7%E8%A1%8C%E7%BB%93%E6%9E%9C&hl=zh-CN%20target=_blank
问题点数:100、回复次数:6Top
1 楼wenyang2004(Smoke)回复于 2005-04-04 12:32:09 得分 20
我也遇到这样的问题
顶一个
Top
2 楼peters()回复于 2005-04-04 13:15:38 得分 0
没有人知道吗? 说一下实现的大概思路也可以呀Top
3 楼wenyang2004(Smoke)回复于 2005-04-04 14:46:20 得分 0
是啊!!
顶Top
4 楼athossmth(athos)回复于 2005-04-04 15:03:39 得分 50
用iframe,然后取得它的document.body.innerHTMLTop
5 楼tf(菜鸟)回复于 2005-04-04 15:43:09 得分 30
IE应该有留这方面的接口吧?
把源代码翻译成HTML。不然QQ的那个什么浏览器怎么做出来的?
所以一定有办法的。你查查IE的一些接口啊。具体看看MSDN拉!Top
6 楼peters()回复于 2005-04-06 19:36:41 得分 0
我是在spider程序里面用,你们说的方法好像都不行哦Top




