...。 改法参见 GIT 仓库,因为输入的数据已经统一转成 UTF-8 了,所以搜索服务端应统一使用 UTF-8 即可。 [url]https://github.com/hightman/xunsearch/commit/b02faaf4a5dbf9e85153782d2c5d5cf6b477259a#diff-1[/url]
[quote='zfzeng' pid='4086' dateline='1299162416'] 下下来只有100多k,解压也是空的,麻烦看下啦 [/quote] 重新下载 我这里没问题的说~
我用editplus把词典和rule转码后似乎不行啊,,,求大侠提供一下:lol :kiss:
第5个测试版继续发布,修正了一些工具脚本在非UTF-8字符集下的兼容问题,预计本周五发布第一个正式稳定版。 下载地址:[url]http://www.xunsearch.com/download/xunsearch-full-latest.tar.bz2[/url] 代码仓库:[url]https://github.com/hightman/xunsearch[/ur...
如题。。。。下载下来的压缩包只有100+K。。
...在65行处看到only support GBK dictionary 到80行,这是不参对utf-8字符处理的,不能对中文(中英混合)字符进行mb_substr($word, 0, $len)切分,[u]mb_substr($word, 0, $len)切分中文会是乱码的。[/u] 所以要人为添加字符串处理涵数,针对utf-8。 [p...
大概是下载不全,你用WGET或专门的下载工具下载吧,网页可能超时了就不全。
...做的,然后下载官方我的演示程序(源代码另存为)。 UTF-8版本的一直不成功,分词结果就如我最开始的截图; GBK版本的在保存文件的时候选择文件编码为ANSI,就一切正常了。如果编码选择GB2312,就会出现随便输入一些字符,...