搜索

大约有 43 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0062秒)

1.怎样才能 字母数字汉字组合 按照词典分成一个词语呢?

发布时间:2013-07-02 17:07 t By shuyinglee

..." 这个词,但是非词的结果却是 "HYC" "888" "仪表" 这三个词语; 确认词典中没有这三个单独的词语; 我的应用中这样的词语很多很多,希望能够整词匹配。 我看了 前面的一个帖子,说要修改源代码,请大侠指导一下,怎么...

2.自定义的词语 用hasword返回true getresult没有出现自定义的词语

发布时间:2014-05-06 19:05 t By min

代码如下: function getwords($string='第一个新增词', $ignore = true, $duality = false, $multi = 3) { this -> cws -> addDict('/res/category/dict_1.txt',SCWS_XDICT_TXT); var_dump($this -> cws ->hasWord("新增词","n")); $this -> cws -> setduality($duality); $this -> cws -> setignore($ig...

3.RE: 想手动指定一些不进行分词的词语

发布时间:2013-07-30 15:07 t By hightman

dict_user.txt 里写是对的,词性不要用叹号,随便写个别的吧。叹号表示删除此词,不分就要让它成为词啊。

4.RE: 怎样才能 字母数字汉字组合 按照词典分成一个词语呢?

发布时间:2013-07-03 14:07 t By hightman

你可以把patch通过 [code] 标签发上来。顺便给你看看改得有没有遗漏。

5.RE: 怎样才能 字母数字汉字组合 按照词典分成一个词语呢?

发布时间:2013-07-03 16:07 t By hightman

这个改法我感觉不怎么好,没有普遍性。这样会导致中英文合的出问题。。。

6.RE: 怎样才能 字母数字汉字组合 按照词典分成一个词语呢?

发布时间:2013-07-03 14:07 t By hightman

其实SCWS内部是允许最多2个非中文字符夹杂中文成词的,超过2个的就无效了。 比如”Q币“,”T恤“这种是支持的。像你这么长的编号支持通用性不强。。

7.RE: 怎样才能 字母数字汉字组合 按照词典分成一个词语呢?

更新时间:2013-07-03 11:07 t By shuyinglee

...夫不负有心人,成功的避过了中英文混合,使用字典中的词语分词,我用的是 scws-1.2.1.tar.bz2 这个版本,因为不能发附件,如果大家需要联系我: Email: shuyinglee@126.com[hr] 使用方法: 1.To patch tar xfvj scws-1.2.1.tar.bz2 cd scws-1.2.1 ...

8.想手动指定一些不进行分词的词语

发布时间:2013-07-23 16:07 t By seagg

一个不懂分词的小白~ 想问下 我用迅搜 如何设定一些词 使得这些词不被scws进行分词 比如 “米兔车贴” 这个词, 被分词成 “米兔车 贴” 我该如何操作,才能使得这个词不被分开 我看到有用户自定义词典 dict_user.txt 我在...

9.词典格式疑问?

发布时间:2010-12-10 00:12 t By lauxinz

...释以 # 或 分号开头。 2) 每行由4个字段组成,依次为“词语"(由中文字或[b]3个以下的字母合成[/b]), "TF", "IDF", "词性", 字段时间用空格或制表符分开,数量不限,可自行对齐以美化。[/quote] “词语"为什么会有3个字母的限制呢...

10.分享:自定义字典无法使用的原因

更新时间:2013-05-23 00:05 t By zouhc

...研究,终于发现自定义字典无法使用的原因。 我在新建词语的时候,词语和FT、IDF之间使用了空格分隔,结果导致新创建的词语无效,后来用记事本打开,突然想起来,原来不能用空格分隔,而是要用TAB键。 如:下面的“空...

12345
  • 时间不限
  • 按相关性排序