df = pd.DataFrame(np.random.randint(1,100, 16).reshape(4, -1), columns=list('pqrs'), index=list('abcd'))
# df
print(df)
# 得到四个列的相关系数
abs_corrmat = np.abs(df.corr())
print(abs_corrmat)
# 得到每个列名与其他列的最大相关系数
max_corr = abs_corrmat.apply(lambda x: sorted(x)[-2])
# 显示每列与其他列的相关系数
print('Maximum Correlation possible for each column: ', np.round(max_corr.tolist(), 2))
#> p q r s
a 59 99 1 34
b 89 60 97 40
c 43 35 14 6
d 70 59 30 53
#> p q r s
p 1.000000 0.200375 0.860051 0.744529
q 0.200375 1.000000 0.236619 0.438541
r 0.860051 0.236619 1.000000 0.341399
s 0.744529 0.438541 0.341399 1.000000
#> Maximum Correlation possible for each column: [0.86 0.44 0.86 0.74]
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。