搜索

大约有 10 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0094秒)

1.疑惑:分词数上限和标点符号控制

发布时间:2013-05-10 17:05 t By Brady.Li

前面发帖没注意发错类目,在此再开一贴 ------------------------------------------------------------ 这个开源项目真心实用,最近在使用一切顺利不过关于两个函数比较疑惑。 使用的是php_scws.dll (1.2.1) ,php扩展 其一: strpos($w['word'],"5) ...

2.RE: SCWS不支持英文和中英文混合分词吗?

发布时间:2010-08-27 10:08 t By hightman

除中文外其余的只按标点符号或空格切分,无缝连在一起的单词字母是不支持的。

3.英文与数字组合词分词错误

发布时间:2014-04-20 16:04 t By tenjin

...情况,英文字母与数字组合分词时,若词的前面或后面有标点符号,则英文字母和数字将会被拆分开,不知道是什么原因?有没有解决的办法? ./scws -c utf8 -i mp3 mp3 +--[scws(scws-cli/1.2.2)]----------+ | TextLen: 3 | | Prep...

4.关于scws和词库的一些建议

更新时间:2011-04-23 21:04 t By lauxinz

...回。 (2)命令行工具scws指定-I选项时,不仅会忽略一些标点符号,同时还会忽略掉一些单字,而文档说只忽略掉一些标点符号

5.使用自定义词库的时候,部分词会丢失

更新时间:2014-04-18 17:04 t By tianly

... $so->set_rule('/usr/local/scws/etc/rules.utf8.ini'); //分词前去掉标点符号 $so->set_ignore(false); //是否复式分割,如“中国人”返回“中国+人+中国人”三个词。 $so->set_multi(false); //设定将文字自动以二字分词法聚合 $so->set_duality(true);...

6.三个问题需要求教

发布时间:2011-01-17 11:01 t By nftw

...变呢?因为我不是太理解un指的是什么,好像助词'的'、标点符号等都被视为un。我在插入全文索引记录的时候,需要排除此类,但又会把像"LG集团"这样的例子给漏掉。 2, 百分数会将数字与百分号分离,如5.7% 会分为 5.7+%,我希...

7.PHP4版 简易中文分词(PSCWS) 第2/3版

发布时间:2007-06-06 09:06 t By hightman

...dbm四个格式) ->set_dict($fpath); // 设定是否删除标点符号 ->set_ignore_mark($trueORfalse); // 设定是否自动进行人名识别 ->set_autodis($trueORflase); // 展示切词过程 ->set_debug($trueORfalse); /...

8.SCWS-php扩展的说明及用法

发布时间:2007-06-07 18:06 t By hightman

...s)[/color] 说明:设定分词返回结果时是否去除一些特殊的标点符号之类。 返回:始终为 true 参数:scws_handle 即之前由 scws_open 打开返回的; yes 设定值,如果为 true 则结果中不返回标点符号,如果为 false 则会返回,缺省...

9.XSTokenizerScws

... 设置散字二元组合 XSTokenizerScws setIgnore() 设置忽略标点符号 XSTokenizerScws setMulti() 设置复合分词选项 XSTokenizerScws 方法明细 __construct() 方法 public void __construct(string $arg=NULL) $arg string 复合等级参数,...

10.Libscws C API 使用说明

更新时间:2010-12-30 22:12 t By hightman

...33cc]0. 概述[/color][/size][/b] Libscws 代码是当前 SCWS(简易中文分词) 算法使用C语言编写的链接库,目前仅基于 Unix 族的操作系统,可能必须适当修改才能运行在 Windows 平台中。这套 scws 库没有外部扩展依赖,代码力争简洁高效,针对...

  • 时间不限
  • 按相关性排序