我想请教一下,我用scws分割了一篇文章,里面把一些词典库里收录了的四字成语分割成一个字一个字的了,这是为什么?有没有什么设置方法能让它被正确地分割出来的?谢谢了~
最近在研究PHP扩展的开发,看了一些资料,发现没有一篇文章、一份资料能非常全面的把PHP扩展开发讲明白,hightman写的scws的php扩展非常好,可以分享一下参考了哪些资料,还有经验总结么?
...01111'); 这样就可以通过 date:2011 或 date:201111 检索到这篇文章 [/quote]
我在自己的网站上使用scws做分词,当文章中有类似PC-BSD之类有连字符的英文词时,都分成类“PC - BSD”,但这是个软件名,本不应分开,英文中加-号的一般都视为一个词,按理说不应分开的,有什么方法解决吗?
基本上会保证在相对前面,但内部用BM25计算的,如果有些文章包含的词次数更多可能会在前面吧。 最好给出例子和实际页面。
...为作cache的原因,所以一次最大只返回100。由于我根据作文章的查询,比如说每页显示100条标题的话,最大值为100的话,在用户点击下一页的,又要连接一次xunsearch,这样效率会很高吗? 假如说最大值为1000,这样我一次取回1000...
...为作cache的原因,所以一次最大只返回100。由于我根据作文章的查询,比如说每页显示100条标题的话,最大值为100的话,在用户点击下一页的,又要连接一次xunsearch,这样效率会很高吗? 假如说最大值为1000,这样我一次取回1000...
每次隔十几分钟后再分析一篇新的文章都很慢啊。都要几秒种。 接着再刷新一次分析一次就很快了0.003秒。 这是为什么。 我复制到官方的演示就很快。很不解。:huh: 官方是不是做了什么优化的? scws1.1.8
...样,我的词典和编译进去的那个词典会一起使用 一些文章带有大量的链接http:// 结果 http com www 这些词 会被放到结果中,要怎么避免?
如果我有多个表, 如果,医院数据表、医生数据表、文章数据表、下载数据表、问答数据表 ,这些表的字段都不一样,不同类型的表,搜索结果的样式也不一样,我该如何来建立索引呢? 我如果把所有的表全部合并到一个表...