...配置文件内容,实际使用时可以将文件保存至 `$prefix/sdk/php/app/discuz.ini`。 ~~~ [php] project.name = discuz project.default_charset = GBK ;服务端用默认值 ;server.index = 8383 ;server.search = 8384 [pid] type = id [fid] index = self tokenizer = full [tid] [first] inde...
参照http://www.ftphp.com/scws/docs.php#instscws安装1.1.2版本。1-9步都安装无误。但第10步安装 php extension 遇到些问题求解答: 问题1: scws.so是在 /usr/local/lib/php/extensions/no-debug-non-zts-20060613/scws.so 我的php.ini中 extension_dir = "./"。 是不是...
...说明,如乱码可在选项后加入 -c gbk 试试。 ~~~ $prefix/sdk/php/util/Logger.php --help ~~~ 主要参数和选项 ------------- 要使用日志工具,必须先指定的项目名称或配置文件,所有的操作都将是作用于该项目,主要选项如下: * _-p|--projec...
... XSTokenizer 始于 1.3.1 版本 1.0.0 源代码 sdk/php/lib/XSTokenizer.class.php SCWS - 分词器(与搜索服务端通讯) Public 方法 隐去继承来的方法 名称描述定义于 __construct() 构造函数 XSTokenizerScws addDict() ...
...久会更新一次词库? 最后,我对github上提供的 get_tfidf.php 中get_count函数做了一下更新,其中corpusUrl依然使用的baidu,如下: // 获取语料库中包含该词的文档数 function get_count( $corpusUrl, $word) { $url = $corpusUrl . urlencode($word)...
...久会更新一次词库? 最后,我对github上提供的 get_tfidf.php 中get_count函数做了一下更新,其中corpusUrl依然使用的baidu,如下: // 获取语料库中包含该词的文档数 function get_count( $corpusUrl, $word) { $url = $corpusUrl . urlencode($word)...
...----------+-----+ 22 rows in set (0.00 sec) 这是Indexer导入的结果 $php /usr/local/xunsearch/sdk/php/util/Indexer.php --project=${project_ini} --charset=utf8 --source=${mysql} --sql="select group_concat(game_tag.tag__id) as tag__id,t.id as id from m as t left join game_tag on t.game__id = gam...
...SSearch::search] 后均会把这些设置恢复到默认值状态。 ~~~ [php] $search->setLimit(5); // 设置返回结果为前 5 条 $search->setLimit(5, 15); // 设置返回结果为 5 条,但要先跳过 15 条,即第 16~20 条。 ~~~ 设置排序方式 ----------- 默认情况,搜索...
...面详细介绍一下 scws-1.1.x 的更新日志及用法举例(示例以PHP扩展语言为例)。 最新版下载地址:[url]http://www.xunsearch.com/scws/download.php[/url] -- [b]scws-1.2.2 发布于 2013-7-11[/b] 1) 改进中英夹杂的长词复合分法,比如 "奥迪A6/奥迪/A6" ...
...XSSearch » XSServer » XSComponent 版本 1.0.0 源代码 sdk/php/lib/XSSearch.class.php XS 搜索类, 执行搜索功能 有部分方法支持串接操作 $xs->search->setQuery($str)->setLimit(10, 10)->search(); $xs->close(); Public 属性 隐去继承来的属性 ...