用ASP写了网页采集程序,其它都搞定了,就是网页需要登录才能采集,谁能给段代码,谢谢了...
同上 问题点数:100、回复次数:24Top
1 楼guestdaocao(稻草人)回复于 2006-10-08 22:16:36 得分 0
模拟登陆就可以了撒……Top
2 楼jiangsheng(蒋晟.Net[MVP])回复于 2006-10-08 22:44:01 得分 0
post a header with a query string of form data to the action URL of the form, and submit session cookies, if anyTop
3 楼bobozc(天使)回复于 2006-10-08 23:43:51 得分 0
能具体说下如何模拟登录吗...谢谢了...Top
4 楼yaozhg(网站开发架构师)回复于 2006-10-09 00:41:20 得分 0
你在运行代码的那台机子上登陆一次不就行了。就是在服务器上登陆。Top
5 楼xuStanly(依依myLove)回复于 2006-10-09 01:04:44 得分 0
顶2楼,在采集时,同时把用户名和密码POST过去。Top
6 楼tim8(重庆龙网校园)回复于 2006-10-28 03:34:57 得分 0
我也想问这个问题,楼上的,具体操作,怎么 post 过去?谢谢!Top
7 楼Unending(看分答题)回复于 2006-10-28 07:41:43 得分 0
登录和其他采集过程基本一样,我非就是要用POST
登录后记住返回的COOKIE,采集其他页面是发送过去就可以了Top
8 楼skyadmin(天宇)回复于 2006-10-28 13:34:26 得分 100
Function getHTTPPage(url,pm)
dim objXML
set objXML=Server.CreateObject("MSXML2.XMLHTTP.5.0") '定义
objXML.open "POST",url,false'打开
objXML.send(pm)'发送
If objXML.readystate<>4 then '判断文档是否已经解析完,以做客户端接受返回消息
exit function
End If
results=objXML.responseBody
getHTTPPage=objXML.responseBody'返回信息,同时用函数定义编码
set objXML=nothing'关闭
if err.number<>0 then err.Clear
End Function
注意getHTTPPage得到的是2进制编码数据
要用response.binarywrite 输出
pm是需要post过去的数据
如a=1&b=3Top
9 楼jspadmin(阿笨狗http://www.pifoo.com域名空间专卖cn20、com50元)回复于 2006-10-28 14:52:23 得分 0
将用户名密码post去Top
10 楼xuStanly(依依myLove)回复于 2006-10-28 15:16:57 得分 0
我也想问这个问题,楼上的,具体操作,怎么 post 过去?谢谢!
==================================================
借skyadmin(天宇) 的
objXML.open "POST",url,falseTop
11 楼Unending(看分答题)回复于 2006-10-28 15:19:00 得分 0
你的问题我好像已经回答过一次了Top
12 楼tim8(重庆龙网校园)回复于 2006-10-28 21:15:40 得分 0
还是不清楚,怎么把用户名和密码post过去
呵呵Top
13 楼hanpoyangtitan(韩波洋)回复于 2006-10-28 21:27:33 得分 0
如果目标网站是cookie验证,好办,把cookies传过去就可以了,如果是session不懂怎么搞了Top
14 楼tim8(重庆龙网校园)回复于 2006-10-28 21:32:50 得分 0
问题是怎么传的问题啊
!Top
15 楼tim8(重庆龙网校园)回复于 2006-10-28 21:38:42 得分 0
关键是怎么把密码和用户名post过去
关键代码是什么
只是不痛不痒的说把这个把那个post过去,我也晓得Top
16 楼hanpoyangtitan(韩波洋)回复于 2006-10-28 21:51:51 得分 0
xmlhttp.setRequestHeader "Set-cookie","username=xxxx......Top
17 楼hanpoyangtitan(韩波洋)回复于 2006-10-28 21:53:21 得分 0
传用户名,密码应该没有用处,一般网站登陆以后都转向指定用户后台,不会转向你的目标页Top
18 楼Novolee(人民子弟兵)(http://biglee.cn/?c)回复于 2006-10-29 13:42:41 得分 0
不知道那些搜索引擎是怎么做到登录的。。Top
19 楼yjbnew(伟大的光荣的正确的ASP千岁千岁千千岁)回复于 2006-10-29 19:17:39 得分 0
markTop
20 楼ATHENA112(18以下请不要回复我的帖子)回复于 2006-10-30 00:41:05 得分 0
session认证一样可以采集,模拟登陆就可以了,但是如果目标站点登陆需要图形验证码的话还要破解验证码,具体代码就不发了,这不是什么好东西感觉。Top
21 楼pzhuyy(喝小酒泡尼姑)回复于 2006-10-30 14:41:22 得分 0
同意楼上,这感觉不是做什么好东西..Top
22 楼lesen(如风)回复于 2006-12-28 18:20:58 得分 0
试试我开发的采集器, 连图片验证码都不怕:
维美智能信息采集大师 (连论坛帖子都能采的采集软件,支持验证码登录)
下载地址: http://searcher.vimei.com/download/
软件特性: .NET(C#)平台开发,支持SQL Server、ACCESS数据库,支持多线程,支持登录验证采集,规则设置灵活,可采集非常多类型的网站资源。
Top
23 楼tangqiaojie(小米虫)回复于 2006-12-28 19:20:44 得分 0
如果是需要登陆才能进去是会影响搜索引擎采集Top
24 楼babay2008()回复于 2006-12-29 13:43:56 得分 0
markTop




