搜索

大约有 20 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0065秒)

1.RE: 关键词包含多个词时,如何让结果按相关度排序?

发布时间:2011-12-13 13:12 t By hightman

基本上会保证在相对前面,但内部用BM25计算的,如果有些文章包含的词次数更多可能会在前面吧。 最好给出例子和实际页面。

2.使用的php_scws.dll1.2.2如何处理中英混合术语,词库中已导入相关

发布时间:2014-11-18 11:11 t By bili

比如我在词述中已导入“创业CEO”这个词,但在输入文章的时候,出现的却是: 创业,CEO 如何将这个词合关成一个单独的词汇? 管理员有办法不?

3.RE: 这个不支持英文词典和中英文混合词典啊

发布时间:2012-02-22 19:02 t By vanni

如果只要文章中有Linux出现就算是Linux相关文章的话,其实是不需要分词了,直接用全文搜索Linux就好了。 只是SCWS目前看前来它的自定义词典不支持超过3个字,如果可以的话,可以通过自定义“Linux优化”来指定分词

4.RE: SQL 导入错误,请问管理同学 sql 导入不支持 DATE_FORMAT(a.inputtime , '%Y%m%d' ) 函数??

更新时间:2012-03-20 15:03 t By a7262619

...享。哎,我只能自己折腾了![hr] 现在国内这些CMS的相关文章,都弱爆了,想用来做相关文章,这样会不会很烦资源,

5.RE:1238

发布时间:2007-06-12 21:06 t By hightman

...这可能是错误的,可以修正词典.关于词典的问题有相关文章已经说过了,词库太大,出错不少,校对是长期而困难的

6.RE: 这个不支持英文词典和中英文混合词典啊

发布时间:2011-12-30 14:12 t By conglei1981

...,其中很多就需要用到一些专业英文单词分词。比如一篇文章是linux相关的我想让“linux”这个词优先被选出来,我在词典里加了linux 可是由于在文章中linux的出现频率低,就不能被分出来反而一些不需要的词例如var char什么的都...

7.高手请进,关于关键字的分词

发布时间:2010-12-19 09:12 t By stevenym

...刚了解scws的这个分词技术,我想请问一下高手,在一个文章里有很多的字,比如“我,的,在,”这些单字,是不是也会被分出来,我想问的是,能不能取出像地名,人名,词语, 我想在一个网站中应该这些,请问有没有相...

8.想在用索引搜索时,输入的关键字不被分词该怎么做?

发布时间:2014-11-20 15:11 t By pbin

...现没达到效果。比如说,我想搜索拥有"味道恶心"这个词的文章,(我的文档库里面是有相关文章的了)搜索的时候出现了大多都是分成了"XX味道"+"XX恶心"的,所以我就在自定义词库"etc/dict_user.txt"里面加入了一行 味道恶心 12.07 1...

9.请问如何同时按relevance和字段同时排序?Xapian好像是支持的,Sphinx是支持这个的。

发布时间:2014-04-30 17:04 t By hina

请问如何同时按relevance和某个字段同时排序?Xapian好像是支持的,Sphinx是支持这个的。比如我想按relevance和时间同时排序,让新发布的文章(产品)在保证相关度的前提下尽量往前面排序,如何做到?

10.求解释TF/IDF计算器中get_tfidf的算法

发布时间:2013-10-30 11:10 t By jjyang

... 有几个问题: 1、当一个词在baidu搜索中找到小于1000篇文章包含该词时,为什么要重新计算count,“21000 - $count * 18” 其中21000是什么?18是什么? 2、对tf的计算过程没明白为什么这么计算,还请赐教。 3、最后5000000000这个数...

12
  • 时间不限
  • 按相关性排序