需求
需要计算某股票在某个周期内的最大回撤率。
最大回撤定义:在选定周期内任一历史时点往后推,产品净值走到最低点时的收益率回撤幅度的最大值。
实现
思路就是将dataframe在groupby之后,通过apply函数处理每个分类的最大回撤,返回一个结果
import numpy as np
import pandas as pd
def getMaxDrawdown(x):
j = np.argmax((np.maximum.accumulate(x) - x) / x)
if j == 0:
return 0
i = np.argmax(x[:j])
d = (x[i] - x[j]) / x[i] * 100
return d
def applyMaxDrawdown(x):
f = x.sort_values("date").reset_index()
array = pd.Series(f["value"])
return getMaxDrawdown(array)
总结
因参考文章实现的是一个series的数据,而我需要处理整个dataframe里面的指标,而这时还不太清楚pandas.groupby.apply的用法
- pandas.groupby.agg是对分组中的某一列进行处理,是将该列传递给agg的函数,当需要同时处理多个列时,agg就有点力不从心
- pandas.groupby.apply是对一个分组进行处理,会将整个分组作为参数传递给appy的函数,因此可以处理多列数据