猎兔站内搜索成功案例
B2B商业搜索
- 项目特点:
- 网站数据量大,超过100万条信息;
- 网站同时在线人数多,高峰时段同时在线人数2000人以上;
- 网站服务器压力大;
- 数据复杂多样;
- 业务规则复杂:针对不同级别的会员,有不同数据采集规则;
- 对用户体验要求高。
- 应对功能:
- 猎兔站内搜索软件,可以在一台P4服务器上,实现600万条数据2000人在线,0.3秒以内的全文检索响应速度;
- 设计数据采集模块与数据库的通用接口,对数据采集规则进行封装,使其具有优秀的可扩展性;
- 数据采集采用增量模式,智能监控数据变化,只采集新加入的和改变后需要更新的数据,数据采集模块根据系统是否繁忙自动调整数据采集速度,控制数据采集程序占用的系统内存和CPU时间。这样可以最大限度的优化使用服务器资源;
- 为提高用户体验,提供了自定义词库、自定义查询关键词过滤词库、高级搜索、分类搜索、相关关键字搜索、多种排序规则等功能模块,从搜索速度、搜索准确度、易用性多方面提高用户体验。
- 实际效果:
- 相比以前的MS Sql Server全文检索,信息检索速度有数十倍的提升;
- CPU使用率降低,大大优化了服务器资源的使用;
- 采用猎兔中文分词后,信息检索更准确易用。
期刊界-学术搜索
- 项目特点:
- 网站数据量大,超过4千万条信息;
- 数据分类多,2级目录,2000多个子类别
- 要求支持多种语言搜索
- 应对功能:
- 猎兔站内搜索软件,可以在一台多核服务器上,实现4000万条数据40G索引容量。
- 设计独立的索引服务器,前后台分离的REST/web service风格的设计,使前台的.net应用具有良好的可扩展性。