jcseg的同义词支持好像有点问题。S01E01这个表示第一季第一集,美剧一般是这样分集的。我想实现 S01的同义词为 第一季 。E01的同义词为第一集。但是我在词典添加了一条记录的时候发现。
第一季/nt/di yi ji/S01 这样的分词结果是输入第一季,可以分词出S01,但输入S01却无法分词出 第一季。
S01/nt/di yi ji/第一季 这样返过来的话,同义词直接无效。
我用的是1.9.5版的。lucene是 4.10.4版的
Jcseg并没有实现同义词自动配对,例如你描述的情况,你要给第一季加一个 S01同义词。
因为Jcseg的词库特点和实现流程,增加此项需要比较大的工作量,所以一直没加上。。。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。