正则表达式去HTML标签问题-被大于号绊住了
想从论坛取一段内容摘要放到其他页。因为只取一部分文字,所以把HTML标签全去掉。为了图省事,我用的正则是——(\<)(.*?)(\>)
部分原文:
……<img onload="javascript:if(this.width>screen.width-500)this.style.width=screen.width-500;" src=……(省略) >……
结果:
screen.width-500)this.style.width=screen.width-500;" src=……(省略) >……
竟然把大于号当成右尖括号来判断了。
想到一个笨办法就是把论坛的输出a>b换成b<a 。
因为刚学会正则的用法,所以还是不死心,问问大家有啥其他好办法没有。
旨在探讨,学习和提高。
(俺刚来不久,头一次发帖。不太了解分数怎么给,希望有热心的朋友说明一下或给个链接地址,多谢!)