Xunsearch 免费开源的专业全文检索解决方案

帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以帮助您降低服务器搜索负荷、极大程度的提高搜索速度和用户体验。

高性能:后端是采用 C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 500 万网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存),参见 Scalability

简单易用:前端是使用脚本语言编写的开发工具 (SDK),目前支持 PHP 语言。API 简单清晰,开发难度极低,提供全中文的示例代码、文档、辅助脚本工具等。

全功能:除支持基础的自定义分词、字段检索、布尔搜索外,还直接支持用户急需的相关搜索、拼音搜索、搜索建议等专业功能,详见 功能特色

快速开始

  1. 最新版版本号:1.3.0
  2. 安装说明 最新功能 体验 DEMO

最新新闻

2012-01-11 17:10
经过一个月的全力开发和测试,今天很高兴先发布 1.3.0 正式版,加入了同义词功能并修正了许多小 BUG,强烈建议所有用户升级到这个最新稳定版本。

1.3.0 堪称一个里程碑级的更新,实现了预期的绝大部分功能,将 xunsearch 带入一个新的阶段。我们以后将着力先进行稳定性的跟进,完善周边配套工具和应用产品。

主要更新如下:

1. 内部优化中文复合词的查询分析器,升级整合最新的 xapian-1.2.8、scws-1.1.9

2. 新增自动同义词搜索功能,详见同义词专题文档
http://www.xunsearch.com/doc/php/guide/special.synonym

3. 调优服务端参数,大幅度提升并发处理能力(3~5倍),精简服务端日志
4. 允许使用空搜索条件,空搜索条件相当于全部匹配
5. 搜索服务端增加请求数、运行时间的监控,避免内存泄露等不稳定因素。
6. 搜索语句的最大长度人 80 字节增加到 192 字节

其它改动详见下面相关链接:

官方网站:http://www.xunsearch.com/
下载地址:http://www.xunsearch.com/download/xunsea...st.tar.bz2
代码仓库:https://github.com/hightman/xunsearch
修改日志:https://github.com/hightman/xunsearch/commits/1.3.0
CHM 手册 http://www.xunsearch.com/download/xs_php_manual.chm

后续方面,我们将进一步推进 xunsearch 的配套管理工具,同时正在重新基于 xunsearch 开发站内搜索云计算服务 xungle ,敬请关注。
2011-12-26 10:16
现在先列出下个版本将引进的主要功能,供大家参考和建议。

1. 同义词搜索,通过API建立、管理同义词库,检索的时候智能匹配同义词进行搜索。比如设置 “xunsearch”与“迅搜”为同义词,那么搜索 xunsearch也会包含迅搜的记录。

2. 增强的搜索查询与匹配,通常像“管理制度”这样的长词将转换成

“管理制度 OR (管理 AND 制度)” 更为合理有效

3. Xapian 将同步升级至 1.2.8

4. 优化 searchd 子进程的定期、定量清理功能,防止内存泄露和其它不稳定因素。

5. 改进 xunsearch 的日志,去掉不必要的啰嗦日志,加入更多关键的错误记录。
2011-12-12 17:19
经过开发给不断的努力和测试,以及吸收了大量网友的反馈意见,很高兴于今天发布 Xunsearch 1.2.0 正式版。

这次修订主要是开发了一些新功能,同时修正了一些 BUG,强烈各位用户建议升级到该最新稳定版本。新增的主要功能如下:

1. 新增搜索日志管理工具 util.Logger,可用于管理热门搜索、相关搜索、搜索建议和纠错等内容。
http://www.xunsearch.com/doc/php/guide/util.logger

2. 小修改大提升,支持自定义 SCWS 分词词典,文本格式。但旧有索引必须重建,新增的词汇才能生效。
http://www.xunsearch.com/doc/php/guide/index.dict

3. 其它一些 PHP-SDK 工具和 API的修改:
XSIndex 对象的各个方法也直接返回对象本身,以支持串接操作。
util.Quest 增加了 --show-query 功能用于查看解析后的内部搜索语句。

4. util.Indexer 增加了 --filter 指定数据过滤器,可以在数据入库前有一次处理的机会。
http://www.xunsearch.com/doc/php/guide/util.indexer#ch6

5. 官方网站文档新增一个 changelog 页面,记录了各大版本号的主要修改差异及文档索引,适合老用户检视新功能。
http://www.xunsearch.com/doc/php/guide/start.changelog

其它改动详见下面相关链接:

官方网站:http://www.xunsearch.com/
下载地址:http://www.xunsearch.com/download/xunsea...st.tar.bz2
代码仓库:https://github.com/hightman/xunsearch
修改日志:https://github.com/hightman/xunsearch/commits/1.2.0
CHM 手册 http://www.xunsearch.com/download/xs_php_manual.chm

此外,接下来我们后续再开发时将先考虑内置支持”同义词搜索“,”搜索切词的细化和优化“。

欢迎提出各种建议和意见。