搜索

大约有 38 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0069秒)

21.修正utf-8版make_xdb_file.php的错误

发布时间:2011-06-09 09:06 t By itlong

...理的,不能对中文(中英混合)字符进行mb_substr($word, 0, $len)切分,[u]mb_substr($word, 0, $len)切分中文会是乱码的。[/u] 所以要人为添加字符串处理涵数,针对utf-8。 [php] function msubstr($str, $start=0, $length, $charset="utf-8", $suffix = false){ $s...

22.RE: 自定义的 txt 字典 有关问题 求助

发布时间:2010-04-09 15:04 t By hightman

那个属性对分词效果有一定影响的,TF主要用于词的切分,IDF用于统计,词性就用在取TOP时过滤或标注上。 最好是基于现有的词典去补充,你重建一个的话数据又都没有效果可能会比较差。SCWS主页上有一个TF/IDF计算器,你可...

23.RE: 在使用scws中遇到的怪问题,ip地址问题和网址都好像有点问题

发布时间:2010-05-26 10:05 t By hightman

是按正常切分的。这个没有单独处理~ 不影响检索~

24.搜索分词只希望第一层怎么办?

发布时间:2014-05-11 00:05 t By dashzhao

...库里面添加“迪卡侬” 所以我不希望“迪卡侬”再被切分,而希望是这样: [code]Xapian::Query(((迪卡侬:(pos=1) OR 蓝色:(pos=2) OR 货品:(pos=3)))[/code] 请问怎么解决呀?

25.C版简易中文分词-cscwsd-0.0.3 发布

发布时间:2007-06-06 10:06 t By hightman

...输入文字即可,每敲入一个回车,服务器立刻返回当前句的切分结果. 几条控制命令,在切分前设定(可不设) /set autodis=[on|off|yes|no] /set ignore_mark=[on|off|yes|no] /set delim=_ 统计词语出现频率?? /set stat=on (开始统计) /set attr=名词,...

26.XSSearch::setScwsMulti

..., 由于 query 设计的方式问题, 目前无法支持搜索语句单字切分, 但您可以在模糊检索时设为 0 来关闭复合分词

27.RE: 在使用scws中遇到的怪问题,ip地址问题和网址都好像有点问题

发布时间:2010-05-26 11:05 t By laxin

[quote='hightman' pid='3577' dateline='1274842781'] 是按正常切分的。这个没有单独处理~ 不影响检索~ [/quote] 那网址是按"."划分.而ip却不是 No. WordString Attr Weight(times) ------------------------------------------------- 01. 192 en 4.86(1) 02. 168 en... 03...

28.RE: 英文模糊搜索问题

发布时间:2013-07-31 15:07 t By homingway

...XSTokenizerUnary implements XSTokenizer { private $length = 1; // 默认切分长度 public function __construct($arg = null){ if ($arg !== null && $arg !== '') $this->length = $arg; } public function getTokens($value, XSDocument $doc=null){ $charset = is_object($doc) ? $doc->ge...

29.英文模糊搜索问题

发布时间:2013-07-31 10:07 t By homingway

...XSTokenizerUnary implements XSTokenizer { private $length = 1; // 默认切分长度 public function __construct($arg = null){ if ($arg !== null && $arg !== '') $this->length = $arg; } public function getTokens($value, XSDocument $doc=null){ $charset = is_object($doc) ? $doc->ge...

30.想在用索引搜索时,输入的关键字不被分词该怎么做?

发布时间:2014-11-20 15:11 t By pbin

想在搜索的时候,关键词按照自己的意愿来切分应该是要怎么做? 文档里看到有个自定义词库的设置,然后根据文档使用了下,发现没达到效果。比如说,我想搜索拥有"味道恶心"这个词的文章,(我的文档库里面是有相关文章的...

1234
  • 时间不限
  • 按相关性排序