搜索

大约有 26 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0074秒)

1.疑惑:分词数上限和标点符号控制

发布时间:2013-05-10 17:05 t By Brady.Li

...么 其二: set_ignore(bool yes) 参数:true的话,表示忽略标点,但是实测中好像' "这种标点是无法忽略的, 如在我使用中会切出 Napoleon's 这种词。所以想具体了解下这个函数所忽略的标点具体是什么?

2.「清除标点符号断词」错误回报

发布时间:2010-05-16 21:05 t By pudding

...常地钦佩。 我安装了SCWS-1.1.2的PHP扩展,并使用「清除标点符号」来进行断词时,发现连非标点符号的字都被省略掉了。 在线演示的网页中也有一样的情况: http://www.ftphp.com/scws/demo/v48.cht.php 输入「館藏選擇與淘汰的原則...

3.不忽略标点符号

发布时间:2014-09-28 17:09 t By joaner1206

...键词也会包含 +- 加号减号等数学符号。 请问如何能保留标点符号作为搜索词? 常见的搜索范例: 已知f(1-2x)=(1-x×x)÷x 已知定义在R上的奇函数f(x),当x≥0时,f(x)=x(1+x),求f(x)的解析式

4.标点符号识别的词性为什么是"un"?

发布时间:2013-08-08 16:08 t By 飞天老鼠

标点符号识别的词性为什么是"un"而不是"w"?

5.RE: 「清除标点符号断词」错误回报

发布时间:2010-05-16 22:05 t By pudding

原来如此,我还以为是根据停用字来清理的。 感谢版主的解说!

6.RE: 不忽略标点符号

发布时间:2014-09-29 16:09 t By xiaobear

建议做个出入库转换,将 +- 加号减号等数学符号转化为特定罕见中文。 如 + -> 枷 - -> 碱 然后在建立索引、处理关键字时做个替换,符号转中文 在呈现给用户时,也做个替换,中文转符号。

7.RE: 「清除标点符号断词」错误回报

发布时间:2010-05-16 22:05 t By hightman

清除符号本质上是根据词性来处理的。勾上词性后发现这些被清除的词性都是 un 所以会被清除,这是因为词典的数据不对导致的,之前的繁体词典是一位朋友帮忙整理的,可能有所缺漏和不对。

8.一个疑问……

发布时间:2007-11-28 22:11 t By 逍遥小妖

...窄…… 对于一个页面来说,通常含有数字、英文、英文标点、中文标点、中文等文字要素(可阅读部分,HTML已过滤),视情况而定,搜索引擎还有可能抓出含有乱码的片段。 但是SCWS分词时似乎要求字符串中只能有中文和中文...

9.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

更新时间:2010-10-21 22:10 t By ymhsky

你好,我测试了一下,消除标点符号时":"还会显示,其它标点就可以。[hr] “{}]好像这几个都清不了

10.关于scws和词库的一些建议

更新时间:2011-04-23 21:04 t By lauxinz

...回。 (2)命令行工具scws指定-I选项时,不仅会忽略一些标点符号,同时还会忽略掉一些单字,而文档说只忽略掉一些标点符号。

123
  • 时间不限
  • 按相关性排序