我最近想要做个网络爬虫,但是对里面的算法和原理不是很懂!希望各位大虾,牛人,专家,智者能指点一下!临网涕零,感激不尽!

ConfidenceMan 2011-02-02 01:56:21
我最近想要做个网络爬虫,但是对里面的算法和原理不是很懂!希望各位大虾,牛人,专家,智者能指点一下!临网涕零,感激不尽!
...全文
181 13 打赏 收藏 转发到动态 举报
写回复
用AI写文章
13 条回复
切换为时间正序
请发表友善的回复…
发表回复
xzf_fancy 2011-05-06
  • 打赏
  • 举报
回复
用搜索控件
whb147 2011-05-03
  • 打赏
  • 举报
回复
很多开源的
就看你要搜索到什么级别
  • 打赏
  • 举报
回复
搜索蜘蛛
原来 2011-04-14
  • 打赏
  • 举报
回复
简单说就是偷东西
子夜__ 2011-03-27
  • 打赏
  • 举报
回复
cjh200102 2011-03-24
  • 打赏
  • 举报
回复
有很多现成的工具。

主要是抓取页面数据,
然后再分解数据。
FLY 2011-03-22
  • 打赏
  • 举报
回复
这个是搜索引擎的?
无涯大者 2011-03-03
  • 打赏
  • 举报
回复
类似于网络 蜘蛛
happyer_longlong 2011-02-02
  • 打赏
  • 举报
回复
提取超链接,然后下载html 分析提取数据 and so on
wuyq11 2011-02-02
  • 打赏
  • 举报
回复
从一个网页入口,分析链接,一层一层的遍历,或者从一组网页入口,或者从一个rss源列表开始爬rss;
获取每个页面的源码保存在磁盘或者数据库里;
遍历抓下来的网页进行处理,比如提取正文,消重等;
根据用途把处理后的文本进行索引、分类、聚类等操作
http://topic.csdn.net/u/20101012/16/50358cc0-76f1-4067-9860-4fc9c6686254.html

12,162

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 Web Services
社区管理员
  • Web Services社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧