分析给定的URL,详细请进
数据库中存放一组URL,现在要求分析这些URL的源头,也就是找出这些URL中哪个是最初的,并且给出这些URL的范围
请大虾帮忙说说具体怎么个做法,我一定思路也没有
谢谢
问题点数:50、回复次数:9Top
1 楼jiangsheng(蒋晟.Net[MVP])回复于 2004-09-02 14:53:59 得分 15
枚举一下就可以了。一般有多个解……Top
2 楼BLsoft(網龍ζ龍活)(Cyber-Security of [MVP])回复于 2004-09-02 14:55:13 得分 10
用CString类足以Top
3 楼mtlab()回复于 2004-09-02 16:02:54 得分 0
枚举怎么能得到源头呢?
难不成把所有的url都列举出来就是范围了,如果有上万条url怎么办?
请大虾说的再详细点好吗?
谢谢Top
4 楼tabby(-_-b .. 内存泄漏)回复于 2004-09-02 16:05:40 得分 0
什么是源头?? www.*****.com ???Top
5 楼jiangsheng(蒋晟.Net[MVP])回复于 2004-09-03 02:29:40 得分 0
如果有循环连接怎么办
例如A<->B
一般网站的分页和主页之间都有互相连接的Top
6 楼mtlab()回复于 2004-09-06 08:31:33 得分 0
主要是通过分析给定的URL找出URL所对应的网页那个是最早发布的(就是源头)
请各位帮忙呀Top
7 楼mtlab()回复于 2004-09-11 08:44:07 得分 0
我们现在确定了一个简单的方案:就是网页发布时间最早就是源头(虽然不怎么准确)
请教各位:如何得到网页的发布时间呢?
谢谢Top
8 楼ouyld(ゎたしすきぁぉた)回复于 2004-09-11 08:50:18 得分 0
讲详细点Top
9 楼yuantao(cfan)回复于 2004-09-11 08:52:50 得分 25
网页也是文件啊,找文件日期不就可以了吗,
可以找这些网页的关键字啊,然后做一些必要的判断,也可以找到源头的
比如www.sohu.com.cn
.sohu.就可以看成是关键字啊,如果前面是www,肯定应该是源头了Top




