首页 新闻 论坛 群组 Blog 文档 下载 读书 Tag 网摘 搜索 .NET Java 游戏 视频 人才 外包 培训 数据库 书店 程序员
中国软件网
欢迎您:游客 | 登录 注册 帮助
  • 数据库搜索引擎 [已结帖,结帖人:cowleyking]
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • cowleyking
    • 等级:
    • 可用分等级:
    • 总技术分:
    • 总技术分排名:
    • 结帖率:
    发表于:2008-08-19 13:21:14 楼主
    请问各位大牛,关于海量数据的查询除了数据库建索引之外,是否还关系到算法问题?
    如果我想做一个数据库方面的搜索引擎该从何着手?
    还有,百度搜索引擎它是怎么从数据库中快速检索到你所输入的关键字的?
    希望得到各位高手的指导,谢谢!
    20  修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • gonxi
    • 等级:
    • 可用分等级:
    • 总技术分:
    • 总技术分排名:
    发表于:2008-08-19 13:49:341楼 得分:10
    搜索引擎一般不用数据库,因为性能太低,文件系统的效率要高,一般使用索引文件来处理

    具体的就是分级索引。通过这个就可以找到关键词,然后通过查询倒排表,来找到相应的页面索引。
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • cowleyking
    • 等级:
    • 可用分等级:
    • 总技术分:
    • 总技术分排名:
    发表于:2008-08-19 16:36:492楼 得分:0
    谢谢楼上的回答,怎样从海量数据中找出符合条件的数据呢?除了给数据库贱索引外还有什么办法?
    是否会牵扯到算法问题?
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • gonxi
    • 等级:
    • 可用分等级:
    • 总技术分:
    • 总技术分排名:
    发表于:2008-08-21 09:30:143楼 得分:0
    这个就是关键词索引,也就是倒排表
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • cowleyking
    • 等级:
    • 可用分等级:
    • 总技术分:
    • 总技术分排名:
    发表于:2008-08-21 10:32:044楼 得分:0
    楼上能否说的详细点?我是菜鸟,再次表示感谢!
    修改 删除 举报 引用 回复
    进入用户个人空间
    加为好友
    发送私信
    在线聊天
    • jimmyzzxhlh
    • 等级:
    • 可用分等级:
    • 总技术分:
    • 总技术分排名:
    发表于:2008-08-22 15:28:075楼 得分:10
    所谓倒排技术就是说,它把“文档里面有哪些词?”转化成了“哪些文档里面出现了某个词?”这样的问题
    也就是说,对于文档里出现的某个词,索引的时候将哪些文档里面含有这个词给找出来,这样在搜索的时候就直接可以搜到了

    关于数据库搜索,现在我使用compass来做,这个引擎还是不错的
    既适合与Hibernate、Spring这种框架结合,也适合直接用Jdbc来建立与数据库的连接
    具体的可以看这里
    http://www.compass-project.org/
    修改 删除 举报 引用 回复

    网站简介广告服务网站地图帮助联系方式诚聘英才English 问题报告
    北京创新乐知广告有限公司 版权所有 京 ICP 证 070598 号
    世纪乐知(北京)网络技术有限公司 提供技术支持
    Copyright © 2000-2008, CSDN.NET, All Rights Reserved