思路: 把每次更新索引时的时间记录起来,然后下次索引,查找所有修改时间,创建时间,和删除时间大于这个值的数据,然后加入到索引库。如果是物理删除的,须记录删除日志。这个是根据我的情况写的,我由于里面没有...
...根据官方的文档进行操作是OK。 但是感觉有点小麻烦。 每次导入的时候都需要指定过滤器。 比如 当我导入数据的时候需要输入 ./util/Indexer.php --rebuild --source=mysql://root:123456@localhost/cusabio --sql="SELECT * FROM proinfo where is_show=1" --p...
...是用最新的版本 我已是了 最新版本的好处是可以restart,每次重启后可以持续一周左右正常 之前的版本得Kill进程再start 跪求xunsearch开发团队早点彻底解决该问题。。。。。。。。。。。。。。 我很愤怒的仍想用xunsearch 还个问...
研究了一下源代码,最终功夫不负有心人,成功的避过了中英文混合,使用字典中的词语分词,我用的是 在调整每次读取数据的大小和缓冲区大小时有不同的情况
...的数据大概在50W条左右,data目录只有不到500M的内容...但是每次搜索都需要40s(真的是40s)的时间才能返回数据 主机是在阿里云上面的,确实磁盘性能很差.. 有什么办法能把数据大量的同步到内存的吗?
...alse; $this->_lastCount = false;} 连接搜索服务端并初始化 每次重新连接后所有的搜索语句相关设置均被还原
过滤器每次都要进行指定。 官方能否在没个ini文件里面直接进行指定这个过滤器。 这样无论是通过管理工具,还是通过sdk 导入数据都可以默认掉用这个过滤器。 这样更便于整个项目的管理。 以后如果我想修改过滤规则,紧紧...