怎么写一段asp.net代码,把一个字符串中所有的HTML标记都去掉,只剩下文字内容呢?
怎么写一段asp.net代码,把一个字符串中所有的HTML标记都去掉,只剩下文字内容呢?
比如:<td width=\"427\" align=\"left\" class=\"cn\">较高的温度,可能增加啤酒对您的诱惑,适量饮用啤酒会给您带来清凉的感觉,但千万注意不要过量呦!</td>
去掉后只剩下:较高的温度,可能增加啤酒对您的诱惑,适量饮用啤酒会给您带来清凉的感觉,但千万注意不要过量呦!
问题点数:20、回复次数:12Top
1 楼jiechifeiniao(飛鳥)回复于 2006-04-04 17:34:11 得分 0
string str1=" <asp:Butilto Width=80px>aaa</asp:Button>bb<bbbbbb>ccc<asdddd>";
string str2="" , str3="";
int i =0 , j=0;
i = str1.Length;
while (j<i)
{
while(str1[j] != '<')
{
str2=str2+str1[j];
j++;
}
j++;
while(str1[j] !='>')
{
j++;
}
j++;
}
str3 =str2;Top
2 楼jiechifeiniao(飛鳥)回复于 2006-04-04 18:14:39 得分 0
好像烦了点,
另外,如果在字符串中含有"<" ">" ,则会计算错误
Top
3 楼kqw(空气外)回复于 2006-04-04 20:31:37 得分 0
正则替换Top
4 楼jonas20()回复于 2006-04-05 09:16:46 得分 0
正则替换
怎么算,我是从网页中读取出来的天气预报!Top
5 楼xrascal(横刀夺爱)回复于 2006-04-05 09:44:57 得分 20
<%@ Page language="c#" AutoEventWireup="false" debug="true"%>
<%@ import Namespace="System.Text.RegularExpressions" %>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" >
<html>
<head>
<title>过滤html标记</title>
<meta name="CODE_LANGUAGE" Content="C#">
<meta name=vs_defaultClientScript content="JavaScript">
<meta name=vs_targetSchema content="http://schemas.microsoft.com/intellisense/ie5">
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<style>
body {font-size:12px;}
</style>
<script runat="server" language="c#">
private void Page_Load(object sender, System.EventArgs e)
{
String text = "<td width=\"427\" align=\"left\" class=\"cn\">较高的温度,可能增加啤酒对您的诱惑,适量饮用啤酒会给您带来清凉的感觉,但千万注意不要过量呦!</td>";
Regex r = new Regex("<[^>]+>", RegexOptions.Compiled);
TextBox1.Text = text;
text = r.Replace(text,"");
TextBox2.Text = text;
}
override protected void OnInit(EventArgs e)
{
InitializeComponent();
base.OnInit(e);
}
private void InitializeComponent()
{
this.Load += new System.EventHandler(this.Page_Load);
}
</script>
</head>
<body>
<form id="Form1" method="post" runat="server">
<span>原字符串:</span>
<div><asp:TextBox id="TextBox1" runat="server" TextMode="MultiLine" Rows=10 Cols="50"/></div>
<BR>
<span>替换后的字符串:</span>
<div><asp:TextBox id="TextBox2" runat="server" TextMode="MultiLine" Rows=10 Cols="50"/></div>
</form>
</body>
</html>
Top
6 楼shalen520(Love will keep us alive)回复于 2006-04-05 09:54:40 得分 0
server.UrlDecode(string)Top
7 楼CityhunterID(城市猎人)回复于 2006-04-05 10:03:33 得分 0
把这个数据当成 xml 格式进行处理。我想可能更加简单一些。
前题是这个数据是一直正确的。
Top
8 楼dingsongtao(一翁傾塵『舍得』)回复于 2006-04-05 10:17:24 得分 0
String text = "<td width=\"427\" align=\"left\" class=\"cn\">较高的温度,可能增加啤酒对您的诱惑,适量饮用啤酒会给您带来清凉的感觉,但千万注意不要过量呦!</td>";
Regex r = new Regex("<[^>]+>", RegexOptions.Compiled);
text = r.Replace(text,"");Top
9 楼Net_2006(自由.Net)回复于 2006-04-05 10:19:30 得分 0
server.UrlDecode(string)Top
10 楼shalen520(Love will keep us alive)回复于 2006-04-06 09:08:36 得分 0
唉,写错了,是HtmlDecode(string)Top
11 楼wwqna(york)回复于 2006-04-06 09:15:37 得分 0
用mshtmlTop
12 楼MonkWang(象写情书一样写程序)回复于 2006-04-06 09:33:54 得分 0
学习
帮顶Top




