从事多年数据研发,公众号:【数据研发技术】作者。 个人主页:http://www.zhujian.site/
Pandas中为数据分类的需求提供专门的类型category,可以由多种方式创建,并结合dataframe或Series进行使用。
有时要处理不同时间的数据,比如对其按日、月、年进行分析。Pandas提供了便捷的方法做这类分析,常用的方法有重新采样、时区设置、周期转换等。
聊聊透视表功能,该功能和Excel中的数据透视功能相似。pivot:对原始DataFrame进行变形整理。pivot table:可以在数据变形整理的基础上,做数据聚合操作。
数据分析时,有时会要对数据做一些变形才能更好地分析,Pandas提供了灵活的方法应对该场景,包括`stack`和`pivot table`
Pandas中提供了groupy方法对数据进行分组
有时可能需要将不同的dataframe合并到后进行分析,讲解两种merge方法:concat和join
pandas进行数据分析的常用功能:系统函数统计、自定义函数统计、数值计数、字符串函数。
pandas在处理缺失数据的几种方法,删除、填充和判断
介绍在pandas中筛选数据的几种方法,快速定位某行、某列、具体元素的方法
通过pandas查看dataframe的数据,包括head、tail、index、columns、describe、T、sort_index和sort_values
介绍pandas创建的几种对象
在不同数据库用SQL实现日期自动填充的方法
介绍秩和比法的应用,及其代码实现
阿里云CentOS添加硬盘
Pandas中inf值替换
pandas计算最大回撤