CSDN首页 空间 新闻 论坛 Blog 下载 读书 网摘 搜索 .NET Java 视频 接项目 求职 在线学习 买书 程序员 通知
花落谁家,你作主! 盛大widget设计大赛英雄榜
CSDN社区
搜索 收藏 打印 关闭
CSDN社区 >  Windows专区 >  Windows 9X

中文分词检索系统

楼主l80d(无悔浪子)2002-03-31 17:16:46 在 Windows专区 / Windows 9X 提问

最近系里在搞一个中文分词检索系统(相当于一个搜索系统),具体是这样的,给你一个大的语料库(譬如:人民日报1998年语料库),其中各个词语已经分好类了,且每个词语都有他的编号.我们这一组所要做的部分是名词检索.具体:把各种文章读进数据库,在读进去的时候必须要去除掉非名词部分,停用词部分,剩下的就是可能被检索的实用词,我们要做的就是把这些实用词分类,以达到高效检索的目的.  
  譬如:要求检索名词"农民"  
  回车以后  
  列出所有有关农民信息的文章且以农民这个名词在该篇文章里出现的词频来排序  
  其中还联系到名词与名词之间的相关性等问题,譬如:计算机与电脑表示的是一个意思,但是怎样把有相关意思的名词联系起来呢,着是个难题!用到的数据结构太多,如:单向连表,hash函数等,由于小弟第一次接触这个东东,没有这方面的经验,希望各位有这方面经历的兄弟姐妹们给点提示,万分谢谢!  
  用c++做,给了我们一份英文单词检索系统的原代码,用java写的做参考,但是英文单词和中文名词检索很多地方不同,思路也就不同了,况且以前没有接触过java,真是苦!  
  再次感谢!  
  有兴趣者,大家一起探讨!  
  突然发现还有话要说:我们要做的是从大的语料库里找出小的语料库里所涉及到的名词,作成自己的名词小词典(倒排索引序列),然后就可以直接通过小的名词词典来检索,找出相关的文章.缩小搜索的范围.  
  大名词词典与小名词词典的问题.  
  问题点数:57、回复次数:1Top

1 楼bigshi(小旋子)回复于 2002-03-31 17:18:01 得分 57

stonbing@163.netTop

相关问题

  • 求中文分词词库
  • lucene中文检索
  • sqlserver中全文检索里分词的困惑,“超级女”查不到....
  • 如何理解lucene默认的中文分词结果?
  • 中文检索问题
  • 请大家来测试我的中文分词(带人名识别)模块
  • 广发英雄帖!顶者有分!求好的中文分词思路。。。。。。
  • 关于lucene的中文检索问题
  • 关于Lucene.Net的中文检索问题
  • 有没有那位大侠写过中文分词的程序!请帮个忙啥!

关键词

  • 检索
  • 中文
  • 系统
  • 名词
  • 语料库
  • 词典
  • 譬如
  • 农民
  • 部分
  • 文章

得分解答快速导航

  • 帖主:l80d
  • bigshi

相关链接

  • CSDN Blog
  • 技术文档
  • 代码下载
  • 第二书店
  • 读书频道

广告也精彩

反馈

请通过下述方式给我们反馈
反馈
提问
网站简介|广告服务|VIP资费标准|银行汇款帐号|网站地图|帮助|联系方式|诚聘英才|English|问题报告
北京创新乐知广告有限公司 版权所有, 京 ICP 证 070598 号
世纪乐知(北京)网络技术有限公司 提供技术支持
Copyright © 2000-2008, CSDN.NET, All Rights Reserved
GongshangLogo