...致一些冷僻汉字不能做到散字自动二元,甚至被当做标点符号清除。 现已更新词典,修正该问题,强烈建议重新下载新词典。下载地址: [URL]http://www.ftphp.com/scws/download.php#dict[/URL] 感谢网友 isS 的不断反馈。
http://www.ftphp.com/scws/demo/v4.php 在这可以查分词结果 用附带的工具 util/Quest.php 加上 --show-query 可以看实际拆分的语句,这样你就明了了。
这是由于 `` 反引号在 shell 中是特殊处理的,代表在命令执行,所以当 PHP 执行时已经被替换为命令结果了。 已在新代码的帮助说明中增加了标注,特别感谢楼主的提示。
前面发帖没注意发错类目,在此再开一贴 ------------------------------------------------------------ 这个开源项目真心实用,最近在使用一切顺利不过关于两个函数比较疑惑。 使用的是php_scws.dll (1.2.1) ,php扩展 其一: strpos($w['word'],"5) ...
...1)词库中词性'#'含义不明确,文档说:# : 表示对应的词是符号系列的单字,没有实际意义,比如日本的假名符号。这类词是不会返回的。 但实际把一些字的属性定义为#,仍然会返回。 (2)命令行工具scws指定-I选项时,不仅会...
[quote='hightman' pid='7112' dateline='1320310178'] 那些全被视为符号了。。。符号其实是指 词性为 un 的 [/quote] 那很奇怪,我用WINDOWS下的DLL ,他就不会把全角字符这个给去掉