Xunsearch 免费开源的专业全文检索解决方案

帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以帮助您降低服务器搜索负荷、极大程度的提高搜索速度和用户体验。

高性能:后端是采用 C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 500 万网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存),参见 Scalability

简单易用:前端是使用脚本语言编写的开发工具 (SDK),目前支持 PHP 语言。API 简单清晰,开发难度极低,提供全中文的示例代码、文档、辅助脚本工具等。

全功能:除支持基础的自定义分词、字段检索、布尔搜索外,还直接支持用户急需的相关搜索、拼音搜索、搜索建议等专业功能,详见 功能特色

快速开始

  1. 最新版版本号:1.3.1
  2. 安装说明 最新功能 体验 DEMO

最新新闻

2012-04-06 10:59
经过较长一段时间的维护和改进,目前 xunsearch 运行较为稳定。今天很高兴发布 1.3.1 正式版,在 SDK 层面加入了许多用户诉求的 scws 分词接口,并修正了许多小 BUG,强烈建议所有用户升级到这个最新稳定版本。

主要更新如下:
1. 增加基于搜索服务端的 XSTokenizerScws 便于直接使用 SCWS 的分词功能, 而不再需要额外安装其 php 扩展,用法详见 SCWS专题文档
http://www.xunsearch.com/doc/php/guide/special.scws

2. 升级整合最新的 xapian-core-1.2.9scws-1.2.0

其它改动详见下面相关链接:

官方网站:http://www.xunsearch.com/
下载地址:http://www.xunsearch.com/download/xunsea...st.tar.bz2
代码仓库:https://github.com/hightman/xunsearch
修改日志:https://github.com/hightman/xunsearch/commits/1.3.1
CHM 手册 http://www.xunsearch.com/download/xs_php_manual.chm
2012-01-11 17:10
经过一个月的全力开发和测试,今天很高兴先发布 1.3.0 正式版,加入了同义词功能并修正了许多小 BUG,强烈建议所有用户升级到这个最新稳定版本。

1.3.0 堪称一个里程碑级的更新,实现了预期的绝大部分功能,将 xunsearch 带入一个新的阶段。我们以后将着力先进行稳定性的跟进,完善周边配套工具和应用产品。

主要更新如下:

1. 内部优化中文复合词的查询分析器,升级整合最新的 xapian-1.2.8、scws-1.1.9

2. 新增自动同义词搜索功能,详见同义词专题文档
http://www.xunsearch.com/doc/php/guide/special.synonym

3. 调优服务端参数,大幅度提升并发处理能力(3~5倍),精简服务端日志
4. 允许使用空搜索条件,空搜索条件相当于全部匹配
5. 搜索服务端增加请求数、运行时间的监控,避免内存泄露等不稳定因素。
6. 搜索语句的最大长度人 80 字节增加到 192 字节

其它改动详见下面相关链接:

官方网站:http://www.xunsearch.com/
下载地址:http://www.xunsearch.com/download/xunsea...st.tar.bz2
代码仓库:https://github.com/hightman/xunsearch
修改日志:https://github.com/hightman/xunsearch/commits/1.3.0
CHM 手册 http://www.xunsearch.com/download/xs_php_manual.chm

后续方面,我们将进一步推进 xunsearch 的配套管理工具,同时正在重新基于 xunsearch 开发站内搜索云计算服务 xungle ,敬请关注。
2011-12-26 10:16
现在先列出下个版本将引进的主要功能,供大家参考和建议。

1. 同义词搜索,通过API建立、管理同义词库,检索的时候智能匹配同义词进行搜索。比如设置 “xunsearch”与“迅搜”为同义词,那么搜索 xunsearch也会包含迅搜的记录。

2. 增强的搜索查询与匹配,通常像“管理制度”这样的长词将转换成

“管理制度 OR (管理 AND 制度)” 更为合理有效

3. Xapian 将同步升级至 1.2.8

4. 优化 searchd 子进程的定期、定量清理功能,防止内存泄露和其它不稳定因素。

5. 改进 xunsearch 的日志,去掉不必要的啰嗦日志,加入更多关键的错误记录。