首页 新闻 论坛 群组 Blog 文档 下载 读书 Tag 网摘 搜索 .NET Java 游戏 视频 人才 外包 培训 数据库 书店 程序员
中国软件网
欢迎您:游客 | 登录 注册 帮助
  • 请问怎么用正则表达式过滤掉非中文的文本
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • bentu610
    • 等级:
    • 可用分等级:
    • 总技术分:
    • 总技术分排名:
    • 揭贴率:
    发表于:2008-08-19 16:12:16 楼主
    用哪个正则表达式可以过滤掉非中文的内容,
    这里的中文指的是所有的汉字,但不包括中文
    的标点
    100  修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • Even__Chung
    • 等级:
    • 可用分等级:
    • 总技术分:
    • 总技术分排名:
    发表于:2008-08-19 16:16:591楼 得分:0
    具体方法我也是不是很清楚
    过滤吧!

    给楼主顶上!

    愿你找到答案!
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • zhangkai08111
    • 等级:
    • 可用分等级:
    • 总技术分:
    • 总技术分排名:
    发表于:2008-08-19 16:22:572楼 得分:0
    添加过滤器。

    pattern = "[\u4e00-\u9fa5]*"
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • rascalboy520
    • 等级:
    • 可用分等级:
    • 总技术分:
    • 总技术分排名:
    发表于:2008-08-19 16:25:053楼 得分:0
    这是我用过的代码,楼主改一下就可以用了,
    Java code
    /** * 处理含有中文字符的url * * @param url * @return 新的url */ public static String enCodeURL(String url, String code) { if (!StringUtil.isFine(url)) return null; Pattern pattern = Pattern.compile( "[\u300a\u300b]|[\u4e00-\u9fa5]|[\uFF00-\uFFEF]", Pattern.CASE_INSENSITIVE | Pattern.DOTALL); Matcher m = pattern.matcher(url); if (m.find()) { int get = m.start(); String suburl = url.charAt(get) + ""; String encodesuburl = ""; try { encodesuburl = URLEncoder.encode(suburl, code); } catch (Exception e) { } url = url.replaceAll(suburl, encodesuburl); url = enCodeURL(url, code); } url = url.replaceAll(" ", "20%"); return url; }
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • acrobatyuer
    • 等级:
    • 可用分等级:
    • 总技术分:
    • 总技术分排名:
    发表于:2008-08-19 16:35:184楼 得分:0
    不懂...但顶起来了....
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • thinkisbest
    • 等级:
    • 可用分等级:
    • 总技术分:
    • 总技术分排名:
    发表于:2008-08-19 16:58:425楼 得分:0
    中文过滤好东西收藏下
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • mayuanfei
    • 等级:
    • 可用分等级:
    • 总技术分:
    • 总技术分排名:
    发表于:2008-08-19 17:02:446楼 得分:0
    1.先把其他的字符替换成空(参考楼上).
    2.再把所有中文标点替换为空.剩下的就是你要的中文了.
    修改 删除 举报 引用 回复

    网站简介广告服务网站地图帮助联系方式诚聘英才English 问题报告
    北京创新乐知广告有限公司 版权所有 京 ICP 证 070598 号
    世纪乐知(北京)网络技术有限公司 提供技术支持
    Copyright © 2000-2008, CSDN.NET, All Rights Reserved