我有一个函数来规范列标题基于一些规则。 代码如下:
def content_normalize(df):
'''
This funcion performs the following steps on the textual columns of a dataframe:
1 - Remove leading and trailing white spaces from columns that starts with [ cd_ , nm_ ];
2 - Update all cd_ column's contents to lowercase and apply unidecode (remove accents and special characters)
Parameters:
A dataframe
Return:
A normalized dataframe
'''
for coluna in df.columns:
if df[coluna].dtype=='O':
if coluna.startswith(('nm_', 'cd_')):
df[coluna]=df[coluna].str.strip()
if coluna.startswith('cd_'):
df.loc[df[coluna].notnull(),coluna]=df.loc[df[coluna].notnull(),coluna].apply(lambda x : unidecode(x))
df[coluna]=df[coluna].str.lower()
return df
现在我需要创建另一个函数来显示未规范化的列列表。如何在不规格化列的情况下生成列表? 问题来源StackOverflow 地址:/questions/59378943/how-to-generate-a-list-of-columns-that-meet-some-requirements
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。