如何提取文章内容的前几十个字???

菜鸟笔记公众号 2008-07-03 02:30:05

如题!!!文章内容保存时含有HTML代码...,即如何先去掉HTML字符,然后显示文字..
...全文
287 16 打赏 收藏 转发到动态 举报
写回复
用AI写文章
16 条回复
切换为时间正序
请发表友善的回复…
发表回复
Bodil 2008-07-04
  • 打赏
  • 举报
回复
mark
diffmaker 2008-07-04
  • 打赏
  • 举报
回复
<[^<>]*>
diffmaker 2008-07-04
  • 打赏
  • 举报
回复
[Quote=引用 7 楼 winner2050 的回复:]
C# code #region 去除HTML标记
/// <summary>
/// 去除HTML标记
/// </summary>
/// <param name="Htmlstring">包括HTML的源码 </param>
/// <returns>已经去除后的文字</returns>
public static string NoHTML(string Htmlstring)
{
if (string.IsNullOrEmpty(Htmlstring )== true)
{
return "";
}…
[/Quote]

你这个杀得太多了吧,呵呵,比如:<b>5<3</b>,用你的杀变成了5,然后实际上应该是5<3,只是一个简单的测试,请完善一下
MADfox1983 2008-07-04
  • 打赏
  • 举报
回复
mark
叶子 2008-07-04
  • 打赏
  • 举报
回复
顶一下4楼和7楼的!
学习了,很好很强大!
maddemon 2008-07-04
  • 打赏
  • 举报
回复
查询的时候查ntext字段不太好吧 内容太多 占内存厉害吧?

应该增加一个摘要字段,在添加时,过滤html,然后取一段文字,比较好
winner2050 2008-07-04
  • 打赏
  • 举报
回复
[Quote=引用 8 楼 diffmaker 的回复:]
你这个杀得太多了吧,呵呵,比如: <b>5 <3 </b>,用你的杀变成了5,然后实际上应该是5 <3,只是一个简单的测试,请完善一下[/Quote]

网页里面的5 <3 ,其实在html 里面是5 <3

“<”符号是html 语言保留字符,要正规途径录入的数据会被转义成“<”的。

pdsnet 2008-07-04
  • 打赏
  • 举报
回复
mark
lugsbbs 2008-07-04
  • 打赏
  • 举报
回复
mark!
winner2050 2008-07-03
  • 打赏
  • 举报
回复
   #region 去除HTML标记
/// <summary>
/// 去除HTML标记
/// </summary>
/// <param name="Htmlstring">包括HTML的源码 </param>
/// <returns>已经去除后的文字</returns>
public static string NoHTML(string Htmlstring)
{
if (string.IsNullOrEmpty(Htmlstring )== true)
{
return "";
}

string temp = Regex.Replace(Htmlstring, "<[^>]*>", "", RegexOptions.Compiled);
return temp.Replace(" ", " ");
}
#endregion


4楼的太麻烦了啦,一句正则表达式就够杀了。。
qiaqia_chen 2008-07-03
  • 打赏
  • 举报
回复
4楼的好专业的,学习了
蝶恋花雨 2008-07-03
  • 打赏
  • 举报
回复
过滤后然后
 HiddenField HTitle = e.Item.FindControl("HFTitle") as HiddenField;
Literal ltTitle = e.Item.FindControl("ltTitle") as Literal;
if (HTitle.Value.Length > 30)
{
ltTitle.Text = HTitle.Value.ToString().PadRight(30).Substring(0,30)+"...";
}
else { ltTitle.Text = HTitle.Value.ToString(); }
蝶恋花雨 2008-07-03
  • 打赏
  • 举报
回复
  #region/// 过滤html,js,css代码
/// <summary>
/// 过滤html,js,css代码
/// </summary>
/// <param name="html">参数传入</param>
/// <returns></returns>
public static string CheckStr(string html)
{
System.Text.RegularExpressions.Regex regex1 = new System.Text.RegularExpressions.Regex(@"<script[\s\S]+</script *>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex2 = new System.Text.RegularExpressions.Regex(@" href *= *[\s\S]*script *:", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex3 = new System.Text.RegularExpressions.Regex(@" no[\s\S]*=", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex4 = new System.Text.RegularExpressions.Regex(@"<iframe[\s\S]+</iframe *>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex5 = new System.Text.RegularExpressions.Regex(@"<frameset[\s\S]+</frameset *>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex6 = new System.Text.RegularExpressions.Regex(@"\<img[^\>]+\>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex7 = new System.Text.RegularExpressions.Regex(@"</p>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex8 = new System.Text.RegularExpressions.Regex(@"<p>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex9 = new System.Text.RegularExpressions.Regex(@"<[^>]*>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
html = regex1.Replace(html, ""); //过滤<script></script>标记
html = regex2.Replace(html, ""); //过滤href=javascript: (<A>) 属性
html = regex3.Replace(html, " _disibledevent="); //过滤其它控件的on...事件
html = regex4.Replace(html, ""); //过滤iframe
html = regex5.Replace(html, ""); //过滤frameset
html = regex6.Replace(html, ""); //过滤frameset
html = regex7.Replace(html, ""); //过滤frameset
html = regex8.Replace(html, ""); //过滤frameset
html = regex9.Replace(html, "");
html = html.Replace(" ", "");
html = html.Replace("</strong>", "");
html = html.Replace("<strong>", "");
return html;
}
#endregion
jamesfay 2008-07-03
  • 打赏
  • 举报
回复
string text;
if (text.StartsWith(xxx)) text = text.SubString(xxxxx)
眼里进了砂 2008-07-03
  • 打赏
  • 举报
回复
正则过滤或者innertext吧
jxufewbt 2008-07-03
  • 打赏
  • 举报
回复
正则表达式








商机、产品、企业-51Sole 搜了网商业搜索引擎
http://www.51sole.com

62,072

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧