Highyman: 能請問一下,我可以將 SCWS 用在繁體中文的分詞上嗎?如果可以,我應該如何產生繁體中文的分詞詞庫呢? 我預備使用 UTF-8 作為中文編碼而非 Big5。 謝謝你的分享。 Mark
事实上,我UTF-8的一直不成功,GBK的就会出现那样奇怪的问题 今天我又再试了一下(GBK版本的),在Windows下,在文件保存的时候,选择编码“ANSI”,这样就不会出现那样奇怪的问题了
... public mixed getCharset() {return} mixed 如果数据库不支持 UTF-8 转换则返回 false 源码: sdk/php/util/XSDataSource.class.php#L138 (显示) public function getCharset(){ if ($this->db->setUtf8()) { return 'UTF-8'; } return parent::getCharset();} 返回...
我想对打断的英文做分词,utf-8,scws可以用么?应该下载哪个版本呢?PSCWS4 说是速度慢,不推荐使用,而PSCWS23 仅支持GBK字符集