太秀了!用Pandas秒秒钟搞定24张Excel报表,还做了波投放分析!(下)

简介: 关于Python批量操作Excel的问题,大家的关注点主要是如何循环遍历表格、如何用Pandas批量处理,为此,我用基于实际业务的脱敏数据,以完整小项目的形式,来集中解决这些问题。

单表操作完成,批量操作,只需要建立好循环+合并关系,并引入日期列,在合并结果中对不同的表数据做好区分:


result = pd.DataFrame()
for name in os.listdir():
    df = pd.read_excel(name)
    df = df.sort_values('品牌搜索人数',ascending = False)
    df['搜索人数排名'] = df['品牌搜索人数'].rank(ascending = False)    
    df['搜索份额'] = df['品牌搜索人数'] / df['品牌搜索人数'].sum()        
    brand = '凌云'    
    brand_data = df.loc[df['品牌'].str.find(brand) != -1,:]        
    other = df.loc[df['品牌'].str.find(brand) == -1,:]    
    other_top5 = other.iloc[:5,:]    
    data = pd.concat([brand_data,other_top5])    
    data['日期'] = name[4:-5]        
    result = pd.concat([result,data])

image.png


Pandas批量操作,就是如此丝滑~


第一个需求搞定。


项目二:品牌投放分析


“在现有数据基础上,找到最近一年投放效果还不错的品牌,要吹吹牛,做年度表彰。”


首席吹牛官以成本数据过于机密为由,除了说各品牌费用基本无差别之外,没有透露任何关于成本方面的数据,我们自然也无法计算投放ROI了这些核心指标了。


目前能够拿到的,只有品牌、搜索人数、点击人数和对应支付人数这几个指标。


要找到最近一年投放效果还不错的品牌,我们可以用漏斗思维,从量级(人数)和效率(转化率)两个角度来考虑


image.png


在费用无差别的情况下:


  • 人群基数大(搜索人数),表示投放的心智效果不错,让更多用户被广告触达后,在平台主动搜相关的品牌。


  • 搜索-点击转化率高,代表了搜索结果的精准度,搜索后展示页面的吸引力等等


  • 点击-支付转化率高,更可能受产品详情页面、活动力度等影响


在项目二场景中,三个指标越高越好。接下来,我们就结合搜索人数,搜索-点击转化率和点击-支付转化率,用Pandas做一波分析。


要对最近一年的数据做分析,我们先把2020年所有数据合并,拿到汇总表:


image.png


再按品牌的维度,做指标汇总:


image.png

计算对应的搜索-点击转化率,点击-支付转化率:


image.png


基础数据齐活了!


从仅有的head5数据可以看到,双敏品牌以160万的搜索人数独占鳌头,但是!排名第二的九方,虽然搜索人数少了40多万,却能凭借较高的搜索-点击转化率和点击-支付转化率,在支付人数上远超双敏,成为支付之王。


表格太晦涩,我们画个图吧:


注:因为分析背景是无差别投放,搜索人数重要性非常高,为了可视化简洁清晰,我们简单粗暴的筛选TOP15品牌来绘图


image.png


根据气泡图,我们按照搜索-点击转化率和点击-支付转化率的高低划分了4个区间:


  • 区间1:高搜索-点击转化,高点击-支付转化
  • 区间2:低搜索-点击转化,高点击-支付转化
  • 区间3:低搜索-点击转化,低点击-支付转化
  • 区间4:高搜索-点击转化,低点击-支付转化


再结合数据表,看的更加清晰:


image.png


结果显而易见,高搜索量级的品牌,主要呈现出两种形态:


  • 以双敏(排名第1)、巨奥(排名第3)为代表的品牌主要分布在第三区间,量级较大,但两种转化效率均需要进一步提升,品牌没能较好的承接蜂拥而至的流量。


  • 九方(排名第2)、商软(排名第4)则是高搜索量级、高转化效率的代表,从现有数据看,他们才是不吹牛集团学习的榜样。
相关文章
|
30天前
|
分布式计算 数据可视化 数据挖掘
Pandas数据应用:社交媒体分析
本文介绍如何使用Pandas进行社交媒体数据分析,涵盖数据获取、预处理、探索性分析和建模的完整流程。通过API获取数据并转换为DataFrame格式,处理缺失值和数据类型转换问题。利用Matplotlib等库进行可视化,展示不同类型帖子的数量分布。针对大规模数据集提供内存优化方案,并结合TextBlob进行情感分析。最后总结常见问题及解决方案,帮助读者掌握Pandas在社交媒体数据分析中的应用。
155 96
|
17天前
|
数据采集 存储 算法
Pandas数据应用:市场篮子分析
市场篮子分析是一种用于发现商品间关联关系的数据挖掘技术,广泛应用于零售业。Pandas作为强大的数据分析库,在此领域具有显著优势。本文介绍了市场篮子分析的基础概念,如事务、项集、支持度、置信度和提升度,并探讨了数据预处理、算法选择、参数设置及结果解释中的常见问题与解决方案,帮助用户更好地进行市场篮子分析,为企业决策提供支持。
60 29
|
28天前
|
数据采集 数据挖掘 数据处理
Pandas数据应用:金融数据分析
本文介绍如何使用Pandas进行金融数据分析,涵盖数据导入、清洗、转换等基础操作。通过处理缺失值、重复值及数据类型不匹配等问题,结合时间序列分析和大规模数据处理技巧,帮助读者掌握常见问题的解决方案。案例分析展示了计算每日收益率并绘制图表的具体步骤。
52 14
|
26天前
|
存储 数据采集 数据挖掘
Pandas数据应用:用户行为分析
本文介绍了如何使用Pandas进行用户行为分析,涵盖从基础概念到实际应用的多个方面。首先简要介绍了Pandas的安装与基本功能,接着详细讲解了数据加载、初步探索及常见问题(如数据缺失、重复记录和时间戳格式不统一)的处理方法。随后探讨了用户活跃度和路径分析等模式挖掘技巧,并总结了常见报错及避免措施。通过掌握这些内容,读者可以更高效地进行用户行为分析,提升产品设计和用户体验。
97 8
|
2月前
|
数据可视化 数据处理 Python
使用Pandas实现Excel中的数据透视表功能
本文介绍了如何使用Python的Pandas库实现Excel中的数据透视表功能,包括环境准备、创建模拟销售数据、代码实现及输出等步骤。通过具体示例展示了按地区和销售员汇总销售额的不同方法,如求和、平均值、最大值等,帮助读者掌握Pandas在数据处理上的强大能力。
67 12
|
3月前
|
Java BI API
Java Excel报表生成:JXLS库的高效应用
在Java应用开发中,经常需要将数据导出到Excel文件中,以便于数据的分析和共享。JXLS库是一个强大的工具,它基于Apache POI,提供了一种简单而高效的方式来生成Excel报表。本文将详细介绍JXLS库的使用方法和技巧,帮助你快速掌握Java中的Excel导出功能。
96 6
|
3月前
|
数据可视化 Python
Pandas 相关性分析
Pandas 相关性分析
42 1
|
5月前
|
Python
pandas 生成 Excel 时的 sheet 问题
pandas 生成 Excel 时的 sheet 问题
47 1
|
5月前
|
数据采集 数据挖掘 数据处理
Pandas实践:南京地铁数据处理分析
Pandas实践:南京地铁数据处理分析
66 2
|
5月前
|
数据采集 索引 Python
pandas处理excel
pandas处理excel