CSDN首页 空间 新闻 论坛 Blog 下载 读书 网摘 搜索 .NET Java 视频 接项目 求职 在线学习 买书 程序员 通知
英特尔®游戏设计大赛100美元现金周周送 专题改版:Java Web 专题
CSDN社区
搜索 收藏 打印 关闭
CSDN社区 >  C++ Builder >  基础类

怎样分析HTML源文件

楼主bbonline()2003-06-01 11:51:59 在 C++ Builder / 基础类 提问

从中文YAHOO搜索  
  http://cn.websearch.yahoo.com/search/web_cn?p=弟兄  
  得到此页面的源文件  
   
  怎样把页面搜索结果的链接和描述说明分离出来(去掉广告内容)  
  最好按一整体放入表格中  
   
   
   
   
  问题点数:100、回复次数:5Top

1 楼sutao0604(benny lee)回复于 2003-06-01 12:02:27 得分 0

呵,用下IE   6.0   的FRONTPAGE   编辑QQ44292362Top

2 楼huzhangyou(信仰(http://www.libing.net.cn))回复于 2003-06-01 12:03:55 得分 50

这样我们就可以通过写一个函数得到一个页面的link了  
  void   GetHtmlText(TStringList   *HtmlString)  
  {  
  IHTMLDocument2   *pHTMLDoc;  
  if(SUCCEEDED(HrGetDoc(&pHTMLDoc)))  
  {  
  IHTMLElement   *pElement;  
  if(SUCCEEDED(pHTMLDoc->get_link(pElement)))//手上没有msdn你查一下    
  {  
  BSTR   bsStr;  
  pElement->get_InnerHTML(&bsStr);  
  try  
  {  
  TStringList   *tempstr;  
                                  tempstr->Strings.Format("%s",(LPCTSTR)bstStr);  
  HtmlString=tempstr;  
  }  
  __finally  
  {  
  delete   tempstr;  
  }  
  SysFreeString(bsStr);  
                          pElement->Release();  
  }  
  }  
  pHTMLDoc->Release();  
  }  
   
   
   
  上面的pElement对象的get_link是关键函数Top

3 楼bbonline()回复于 2003-06-01 14:56:45 得分 0

我需要链接的描述说明  
  如何得到  
   
  另外我要过滤那些广告连接啊Top

4 楼huzhangyou(信仰(http://www.libing.net.cn))回复于 2003-06-01 17:11:47 得分 50

你看看msdn  
  手头真的没有  
  不过大体的方向可以给你  
  这是baidu的<body   bgcolor=#ffffff   text=#000000   link=#261CDC   topmargin=0   bottommargin=0   leftmargin=0   rightmargin=0>  
  <table   width=100%   border=0>  
  <form   action="/baidu"><tr><td   width=244><a   href="http://www.baidu.com/"><img   src="http://img.baidu.com/img/yy.gif"   border="0"></a>  
  <td   valign=middle><script   language="JavaScript">  
   
  你应该分离出上面的form部分  
  这个方法在msdn上可以查到  
  然后要得到某个table内的InnerHtml  
  等等  
   
  Top

5 楼bbonline()回复于 2003-06-01 19:39:13 得分 0

哎,这东西俺不熟悉的  
   
  看上面的代码只是取出了所有的LINK  
   
  Top

相关问题

  • 怎样在后台打开网页的源文件并进行代码分析?
  • 怎样使用资源文件?
  • win32asm怎样连接资源文件??
  • 得到的html源文件中中文显示的是乱码,怎样正确显示呢?
  • 使用资源文件的好处是什么?用记事本怎样编辑一个资源文件?
  • 怎样创造资源文件,并在资源文件中加入图标和图片。
  • 我在html页面怎样嵌入一段javascript代码,把本页面的源文件读出来显示在一个text里面
  • 怎样引用资源文件中的东西呢?
  • ******怎样利用资源文件实现外文界面******
  • 怎样播放资源文件中的MIDI流?

关键词

  • 页面
  • bsstr
  • phtmldoc
  • pelement
  • tempstr
  • 得到
  • link
  • get

得分解答快速导航

  • 帖主:bbonline
  • huzhangyou
  • huzhangyou

相关链接

  • CSDN Blog
  • 技术文档
  • 代码下载
  • 第二书店
  • 读书频道

广告也精彩

反馈

请通过下述方式给我们反馈
反馈
提问
网站简介|广告服务|VIP资费标准|银行汇款帐号|网站地图|帮助|联系方式|诚聘英才|English|问题报告
世纪乐知(北京)网络技术有限公司 版权所有, 京 ICP 证 020026 号
北京创新乐知广告有限公司 提供技术支持
Copyright © 2000-2007, CSDN.NET, All Rights Reserved
GongshangLogo