...修改,可以实现在词库里添加英文单词,修改的地方只有一个。 scws.c 修改一个宏定义即可:(粗体部分为修改的) #define SCWS_PUT_RES(o,i,l,a) \ do { \ scws_res_t res; \ res = (scws_res_t) malloc(sizeof(struct scws_result)); \ re...
... -- no leaks are possible. 大致说明:分词结果中每成功分出一个汉语词组就发生一次内存未释放。 [[i] 本帖最后由 mfd 于 2007-11-27 10:51 编辑 [/i]]
...] => ns ) ) 刷新后:([b][color=#FF0000]只能取得第一个[/color][/b]) Array ( [0] => Array ( [word] => 印第安那 [times] => 3 [weight] => 47.939998626709 [attr] => ns ) ) [b]在XDB词典...
...安装日志见:http://bbs.xunsearch.com/showthread.php?tid=765 我在一个vps(1G内存)上建立了两个项目,对应两个网站,大家可以测试下。效果蛮好的(已经抛弃了hdwiki自带的tag搜索和全文搜索,仅保留了它的title搜索)! a, 中文PubMed...
...鉴于%这个需求可有可无,而且会产生歧义,只修改了第一个需求[hr] 补丁如下: 680c680 < strcpy(wmap[i][i]->attr, attr_un); --- > strcpy(wmap[i][i]->attr, SCWS_IS_ALPHA(txt[start-1]) ? attr_en : attr_un); // modified by hightman[...
昨天弄了一晚上, 因为我是写php的对C语言不熟系,研究了一下源代码,最终功夫不负有心人,成功的避过了中英文混合,使用字典中的词语分词,我用的是 scws-1.2.1.tar.bz2 这个版本,因为不能发附件,如果大家需要联系我: Ema...
...输入数据) ... 1,关于 xunsearch 的 DEMO 项目测试,项目测试是一个很有意思的行为!,1314336158 2,测试第二篇,这里是第二篇文章的内容,1314336160 3,项目测试第三篇,俗话说,无三不成礼,所以就有了第三篇,1314336168 INFO: reach end of file or ...
..., calls:1, tid:0x47006940, task:{}}[/php] 找到问题原因了,当某一个字段设置type=numeric,且字段值是浮点型时,某个xs search进程占用cpu和内存迅速升高,并一直维持在占用资源很高的状态。手册关于type=numeric的说明,“numeric 数值型,包...
...输入数据) ... 1,关于 xunsearch 的 DEMO 项目测试,项目测试是一个很有意思的行为!,1314336158 2,测试第二篇,这里是第二篇文章的内容,1314336160 3,项目测试第三篇,俗话说,无三不成礼,所以就有了第三篇,1314336168 INFO: reach end of file or ...
...tr] => un ) [2] => Array ( [word] => 一个 [off] => 6 [len] => 6 [idf] => 1 [attr] => mt ) [3] => Array ( [word] => 中 [off] => 12 [len] => 3 ...