...始一直在取舍,最后敲定了scws 经过部分测试,scws的分词还是比较准确的, 当然还是需要大量的数据测试, 以及一段时间的试运行才会有更好的结果。 就是社区稍显冷清。。呵呵 新项目内部命名为super.maria 。 策划了有一段...
...进程?(实验结果是,求确认) 2、只监视dict_user.txt,还是会扫描、装载etc目录下所有的txt? 3、自定义词库后,系统内置词库是否同时还生效,还是只用用户自定义了? 4、能否在北大词性列表外和@外自定义词性,比如美食...
[quote='hightman' pid='3722' dateline='1284865451'] 你说的是哪个包解开是空的啊,是软件包还是词典,谢谢 [/quote] 刚才又下载试了下,1.1.3的软件包没问题了,但是utf8的字典包还是有问题,下下来只有100多k,网站上标明有3M多的
...上解决问题,如果我要查询的分类很多的话,比如30个,还是会报 Data/Name too long 的异常,有没有能够从根本上解决这个问题的方法呢?还是我的搜索策略需要改变?
...果的情况下 怎么排序都意义不大 所牵涉的样本比例太小 还是让用户做进一步筛选是正道[hr] 仔细想下 这个需求意义不大 200万个搜索结果的情况下 怎么排序都意义不大 所牵涉的样本比例太小 还是让用户做进一步筛选是正道
...eline='1284865451'] 你说的是哪个包解开是空的啊,是软件包还是词典,谢谢 [/quote] 刚才又下载试了下,1.1.3的软件包没问题了,但是utf8的字典包还是有问题,下下来只有100多k,网站上标明有3M多的 [/quote] 可能是网速问题导致...
...性大大增强 那如果升级硬件,重点是内存呢?CPU呢?还是硬盘呢? 内存的话常见也就DDR3和ECC可选项 CPU是注重整体效果如多核多CPU,还是更依赖于单核心的性能呢? 硬盘SSD做raid速度能达到400M/s情况下 会对搜索速度有...
...郁闷了。自己定义的词语调用到了,规则调用到了,词典还是没调用到! 我的词典路径肯定没错!! 但是还是调用不到啊!![hr] 现在是这样的情况,在本地,我测试了一下,程序没半点问题,能正常分词 我用FTP传到服务器...
照这方法还是不行,不死机,Process 14193 attached - interrupt to quit futex(0x8063c48, FUTEX_WAIT_PRIVATE, 18, NULL [hr] 照这方法还是不行,不死机,Process 14193 attached - interrupt to quit futex(0x8063c48, FUTEX_WAIT_PRIVATE, 18, NULL
...下载的XDB导入导出工具 起初我以为是我改的txt格式不对还是怎么的 后来我直接将xdb导出成txt,如下 php E:\www\dump_xdb_file.php E:\www\dict.xdb E:\www\1.txt 成功导出之后,不做任何修改 再执行下面 php E:\www\make_xdb_file.php E:\www\dict.xdb E:\...