搜索

大约有 30 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0084秒)

11.分词初试,结果

发布时间:2010-09-06 10:09 t By xiaowang19

...后下载官方DEMO(源码另存为)来运行的时候,分词结果对,明其中原因。 DEMO:http://www.ftphp.com/scws/demo/v48.php 输入的文本也是官方DEMO一样的,分词结果如下: ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 陈凯歌 并 是 《 ...

12.好消息,scws-0.0.1 pre 版发布!!

发布时间:2007-06-09 11:06 t By hightman

好消息,scws-0.0.1 pre 版提前发布,好多朋友停的期待和催盼,这个套件先发布一个 pre 版。包括了全部代码和一份GBK词典和相关说明。为适当统计下载的人群和数量,该文件设为必须必须论坛会员才能下载,由此便深感抱歉...

13.RE:1251

发布时间:2008-04-26 08:04 t By hightman

...示: [url]http://www.hightman.cn/demo/scws/v48.cht.php[/url] 引擎本身需要更改, 只需要将rules.utf8.ini和dict.utf8.xdb改为繁体的词典即可. 词典制作参见相关代码里的工具 scws-1.0 里包含了词典制作工具. 顺便奉上之前整理制作的繁体数据. ...

14.如何获取到分词对应的id

发布时间:2011-01-30 11:01 t By michael

...,可以进行分词,但返回格式里没有对应词的id,这样我就能拿词id查询对应的文字id 难道我还要拿分词再查找对应的词库来获取id?这样就太慢了,估计是这样做的,知道大家怎么解决这个问题的。 [php] Array ( [0] => A...

15.set ignore bug ?全角数字见了

发布时间:2011-11-03 13:11 t By xjtdy888

...试了自带的scws程序,加上-I选项后也是同样的,全角字符显示 下面是我的测试。 [xxxxxx@www etc]$ scws -r rules.utf8.ini -d dict.utf8.xdb -c utf-8 -I 今天花了12万元啊 今 天花 了 万 元 啊 [xxxxx@www etc]$ scws -v scws (scws-cli/1.1.8: Simpled C...

16.PSCWS4使用问题

更新时间:2010-10-21 17:10 t By hnmazda

...tmp['times'], $tmp['weight']); } $cws->close(); utf8编码好像使用了,我把所有文件(ini,php,包括test.php)都改成utf8编码存储,header输出的也是utf8编码,执行默认的test.php,产生乱码,知道问题出现在哪?dict.utf8.xdb是新下载的没有动,...

17.【已解决】【感谢hightman帅哥的耐心解答,我是个人站长,要是我做起来了一定赞助您撒,

更新时间:2010-07-15 01:07 t By sulwan

...看统计打钩 并写 2 官方结果明显正确,为啥我安装的一样的呢? 在说第三点: 删除词条: 输入:陈凯歌是个帅哥吗 我限制了删除了 陈凯歌 但是实际没有效果啊, 代码可以直接查看,限制词典位置在: http://sj...

18.2007简易分词第4版(scws-0.1.x)体验

发布时间:2007-06-06 11:06 t By hightman

...支持自定义规则的人名等专名自动识别,也支持UTF-8/GBK等同字符集。经评估测试分词准确率在 95% 左右,召回率有 92% 以上。 这套程序的开发其实很早就开始做基础工作了,持续时间和耗费精力都相当大。开始全部采用纯 php...

19.关于 SCWS 简易中文分词系统

更新时间:2013-01-10 16:01 t By hightman

...切分成词,因为词是汉语的基本语素单位,而书写的时候像英语会在词之间用空格分开,所以如何准确快速的分词一直是中文分词的攻关难点。 本分词法并无太多创新成分,采用的是自己采集的词频词典,并辅以一定的专有...

20.scws_set_multi复式分割无效

更新时间:2011-11-03 17:11 t By xjtdy888

scws_set_multi复式分割起作用,同样的windows .dll测试是可以正常的。 以下是测试代码,是在你的文档例子代码上加入了 scws_set_multi(s , 1); [code] #include #include main() { scws_t s; scws_res_t res, cur; char *text = "上海市"; if (!(s = scws_new())...

123
  • 时间不限
  • 按相关性排序