Python 数据挖掘中,文本相似度计算里基于知识组织的方法有哪些呢?
主要分为两大类:
一、 基于本体:
1. 基于距离,用概念之间的路径长度表示语义距离。
2. 基于内容,用概念词共享的信息量化它们之间的语义相似度。
3. 基于属性,用概念词之间的公共属性数量衡量它们之间的相似度。
二、基于网络知识:
1. 维基百科,由于本体中词语数量的限制,而百科覆盖范围广泛、富含丰富的语义信息、更新速度相对较快。
2. 百度百科,百度百科已经有千万级词条。
3. 其它各种百科:有词条其它各种百科:有词条条的链接页面。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。