基于商的数据离散化方法中的信息商是如何计算的啊?
对于一个数据集D,用 P 来代表其每一个类别的概率,如果该数据集D 有m个类,那么其信息商的计算可以通过公式计算,计算公式为:
Info(D)的含义是根据数据分布,要弄清数据集D中的每一个数据对象类标签所需要的信息量。 对于该数据集中的一个属性S ,如果使用一个分裂点T可以将该数据集分为两个部分,S1和S2,在这种条件下可以计算一个信息商,计算公式为:
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。