文档备案控制台

开发者社区问答正文

python中数据离散化分类中的基于信息熵分组中熵的概念是什么？

python中数据离散化分类中的基于信息熵分组中熵的概念是什么？

展开

收起

游客qzzytmszf3zhq 2021-11-30 01:13:32 436 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客yzrzs5mf6j7yy

熵，是在结果出来之前对可能产生的信息量的期望——考虑该随机变量的所有可能取值，即所有可能发生事件所带来的信息量的期望。

可以表示为：E(x) = -\sum_{i=1}^{n}p(x_i)log_{2}p(x_i)

    按照随机变量的所有可能取值划分数据的总熵E是所有事件的熵的加权平均：E = \sum_{i=1}^{k}w_iE_i

式中，w_i = \frac{m_i}{m}是第x个事件出现的比例，是第个可能取值出现的次数，是所有取值出现的总次数。

2021-11-30 01:13:50

赞同展开评论

问答分类：

Python

问答标签：

Python数据 Python概念 Python信息 Python分类 Python数据信息

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

使用key通过 python下载数据列--请问具体是使用的哪个功能？

836

1

0

maxcomputer使用key通过 python下载数据列中文内容每次都是乱码需要解析，怎么解决？

838

1

0

dataworks python3节点返回数据后不能自动停止运行，请问如何处理？

974

1

0

我想问下 dataworks的 python节点能否直接读取holo上的表的数据

1240

1

0

python中数据离散化分类中的基于信息熵分组中信息量的概念是什么？

600

1

0

python中数据离散化分类中的基于信息熵分组的概念是什么？

476

1

0

我用最基础的Hello world用例测了一下，发现python的函数执行速度比java快很多【py

1486

2

0

请问Python写的函数可以在中台调用吗? 数据中台为什么不支持pandas包?

1237

1

0

函数运行 /opt/python/scrapy crawl pubs 提示没有权限怎么办呢？直接使用

1260

1

0

请问我的一个python脚本想直接在函数计算中跑，这个脚本是一直运行的状态，但创建函数我看到都有执行

1298

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

我用qoder 和 codex+deepseek 及claude + qwen 3.7同时解题目

阿里云服务器多少钱一年？支持40个连接的配置

阿里云服务器多少钱一年企业用？公司用什么配置？

阿里云服务器多少钱一年？企业用的配置费用价格

阿里云服务器多少钱一年？学生用的配置价格

相关文章

全局变量不“全局”？Python多进程这口黑锅背得冤

阿里云Qwen3.7-Max接入百炼大模型服务流程：API 调用、Token Plan订阅两种接入方式流程参考

RPA OCR 文字识别实战：本地离线识别、发票 / 合同多模态信息提取

构建高可用大模型应用架构：大模型服务进程保活 + 全自动故障自愈实践.163

海洋边缘交换二期（OMEX II）项目

相关解决方案

更多

多模态数据信息提取

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

数据守护：防勒索攻击数据保障

还有其他疑问?