如何提取文章内容的前几十个字???

菜鸟笔记公众号 2008-07-03 02:30:05

如题!!!文章内容保存时含有HTML代码...,即如何先去掉HTML字符,然后显示文字..

...全文

287 16 打赏收藏转发到动态举报

写回复

用AI写文章

16 条回复

切换为时间正序

请发表友善的回复…

发表回复

Bodil 2008-07-04

打赏
举报

mark

diffmaker 2008-07-04

打赏
举报

<[^<>]*>

diffmaker 2008-07-04

打赏
举报

[Quote=引用 7 楼 winner2050 的回复:]
C# code #region 去除HTML标记
/// <summary>
/// 去除HTML标记
/// </summary>
/// <param name="Htmlstring">包括HTML的源码 </param>
/// <returns>已经去除后的文字</returns>
public static string NoHTML(string Htmlstring)
{
if (string.IsNullOrEmpty(Htmlstring )== true)
{
return "";
}…
[/Quote]

你这个杀得太多了吧，呵呵，比如：<b>5<3</b>，用你的杀变成了5，然后实际上应该是5<3，只是一个简单的测试，请完善一下

MADfox1983 2008-07-04

打赏
举报

mark

叶子 2008-07-04

打赏
举报

顶一下4楼和7楼的！
学习了，很好很强大！

maddemon 2008-07-04

打赏
举报

查询的时候查ntext字段不太好吧内容太多占内存厉害吧?

应该增加一个摘要字段，在添加时，过滤html，然后取一段文字，比较好

winner2050 2008-07-04

打赏
举报

[Quote=引用 8 楼 diffmaker 的回复:]
你这个杀得太多了吧，呵呵，比如： <b>5 <3 </b>，用你的杀变成了5，然后实际上应该是5 <3，只是一个简单的测试，请完善一下[/Quote]

网页里面的5 <3 ，其实在html 里面是5 <3。

“<”符号是html 语言保留字符，要正规途径录入的数据会被转义成“<”的。

pdsnet 2008-07-04

打赏
举报

mark

lugsbbs 2008-07-04

打赏
举报

mark!

winner2050 2008-07-03

打赏
举报

   #region 去除HTML标记

        /// <summary>

        /// 去除HTML标记

        /// </summary>

        /// <param name="Htmlstring">包括HTML的源码 </param>

        /// <returns>已经去除后的文字</returns>

        public static string NoHTML(string Htmlstring)

        {

            if (string.IsNullOrEmpty(Htmlstring )== true)

            {

                return "";

            }

 

            string temp = Regex.Replace(Htmlstring, "<[^>]*>", "", RegexOptions.Compiled);

            return temp.Replace(" ", " ");

        }

        #endregion

4楼的太麻烦了啦，一句正则表达式就够杀了。。

qiaqia_chen 2008-07-03

打赏
举报

4楼的好专业的，学习了

蝶恋花雨 2008-07-03

打赏
举报

过滤后然后

 HiddenField HTitle = e.Item.FindControl("HFTitle") as HiddenField;

            Literal ltTitle = e.Item.FindControl("ltTitle") as Literal;

            if (HTitle.Value.Length > 30)

            {

                ltTitle.Text = HTitle.Value.ToString().PadRight(30).Substring(0,30)+"...";

            }

            else { ltTitle.Text = HTitle.Value.ToString(); }

蝶恋花雨 2008-07-03

打赏
举报

  #region/// 过滤html,js,css代码

    /// <summary>

    /// 过滤html,js,css代码

    /// </summary>

    /// <param name="html">参数传入</param>

    /// <returns></returns>

    public static string CheckStr(string html)

    {

        System.Text.RegularExpressions.Regex regex1 = new System.Text.RegularExpressions.Regex(@"<script[\s\S]+</script *>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);

        System.Text.RegularExpressions.Regex regex2 = new System.Text.RegularExpressions.Regex(@" href *= *[\s\S]*script *:", System.Text.RegularExpressions.RegexOptions.IgnoreCase);

        System.Text.RegularExpressions.Regex regex3 = new System.Text.RegularExpressions.Regex(@" no[\s\S]*=", System.Text.RegularExpressions.RegexOptions.IgnoreCase);

        System.Text.RegularExpressions.Regex regex4 = new System.Text.RegularExpressions.Regex(@"<iframe[\s\S]+</iframe *>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);

        System.Text.RegularExpressions.Regex regex5 = new System.Text.RegularExpressions.Regex(@"<frameset[\s\S]+</frameset *>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);

        System.Text.RegularExpressions.Regex regex6 = new System.Text.RegularExpressions.Regex(@"\<img[^\>]+\>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);

        System.Text.RegularExpressions.Regex regex7 = new System.Text.RegularExpressions.Regex(@"</p>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);

        System.Text.RegularExpressions.Regex regex8 = new System.Text.RegularExpressions.Regex(@"<p>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);

        System.Text.RegularExpressions.Regex regex9 = new System.Text.RegularExpressions.Regex(@"<[^>]*>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);

        html = regex1.Replace(html, ""); //过滤<script></script>标记 

        html = regex2.Replace(html, ""); //过滤href=javascript: (<A>) 属性 

        html = regex3.Replace(html, " _disibledevent="); //过滤其它控件的on...事件 

        html = regex4.Replace(html, ""); //过滤iframe 

        html = regex5.Replace(html, ""); //过滤frameset 

        html = regex6.Replace(html, ""); //过滤frameset 

        html = regex7.Replace(html, ""); //过滤frameset 

        html = regex8.Replace(html, ""); //过滤frameset 

        html = regex9.Replace(html, "");

        html = html.Replace(" ", "");

        html = html.Replace("</strong>", "");

        html = html.Replace("<strong>", "");

        return html;

    }

    #endregion