【python】python商家会员数据分析可视化(源码+数据集+课程报告论文)

简介: 【python】python商家会员数据分析可视化(源码+数据集+课程报告论文)

一、数据处理清洗

1. 数据读取与准备

从两个Excel文件中提取所需的数据。这包括任务的GPS坐标、会员的GPS坐标和会员的信誉值。使用pandas库读取Excel文件是因为它提供了强大的数据处理功能,可以轻松处理大量数据,并且支持多种数据操作,如筛选、排序和聚合,这对后续的数据分析至关重要。

2. 距离计算

设计中核心的部分是计算任务地点和会员位置之间的地理距离。距离计算使用了地球上两点间的近似距离公式,这需要将纬度和经度转换为弧度,然后应用特定的地理计算公式。这一步骤关键在于准确和高效地处理数学运算。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “商会” 获取。👈👈👈

3. 任务吸引力分析

根据计算出的距离,进一步分析特定任务的吸引力。例如,统计在5公里范围内的会员数量,和这些会员的信誉值总和。这不仅涉及基本的条件筛选,也涉及到数据聚合。


二、数据可视化

首先,从Excel文件中读取了两组数据,一组是已结束项目任务数据,另一组是会员信息数据。为了处理这些数据,使用了pandas库来读取Excel文件并将数据存储在DataFrame中。这两个文件分别包含了任务的详细信息(包括任务编号、GPS坐标、标价和执行情况)和会员的详细信息(包括会员编号、位置、预订任务限额、预订任务开始时间和信誉值)。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “商会” 获取。👈👈👈

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号

tasks_df = pd.read_excel('已结束项目任务数据.xlsx', engine='openpyxl')
members_df = pd.read_excel('会员信息数据.xlsx', engine='openpyxl')

为了计算特定任务位置与所有会员位置之间的距离,定义了一个距离计算函数calculate_distance。该函数使用了地球表面的弧长公式,考虑了纬度和经度的变化,确保计算的准确性。然后,提取了特定任务(A0001和A0002)的GPS坐标,并计算了每个会员到这两个任务位置的距离。

def calculate_distance(lat1, lon1, lat2, lon2):
    phi1, phi2 = np.radians(lat1), np.radians(lat2)
    lambda1, lambda2 = np.radians(lon1), np.radians(lon2)
    delta = 111.199 * np.sqrt((phi1 phi2)  2 + ((lambda1 lambda2)  2) * np.cos((phi1 + phi2) / 2)  2)
    return delta

进行了两项具体的统计分析:计算任务A0001在5公里范围内的会员个数。计算任务A0002在5公里范围内所有会员的信誉值总和。

这些统计数据可以帮助了解不同任务的会员参与情况和信誉情况,从而更好地评估任务的完成质量和会员的分布情况。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “商会” 获取。👈👈👈

print(S_A0001)
print(S_A0002)

print("A0001任务5公里范围内的会员个数:", A0001_Bnum)
print("A0002任务5公里范围内所有会员信誉值总和:", A0002_Bavg)

柱状图:展示了前15个任务的标价分布。

通过柱状图分析,可以直观地比较不同任务的标价,了解任务标价的整体分布情况。

散点图:展示了前15个会员的位置和信誉值。

通过散点图分析,展示了前15个会员的位置和信誉值,横轴和纵轴分别表示会员的纬度和经度,每个点的颜色代表对应会员的信誉值。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “商会” 获取。👈👈👈

直方图:展示了前10个任务的标价分布频率。

通过直方图分析,展示了前10个任务的标价分布频率,横轴表示任务标价的区间,纵轴表示每个标价区间内任务的数量。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “商会” 获取。👈👈👈

折线图:展示了前15个任务的标价变化趋势。

通过折线图分析,展示了前15个任务的标价变化趋势,横轴表示任务编号,纵轴表示任务标价。

饼状图:展示了任务执行情况的比例分布。

通过饼状图分析,展示了任务执行情况的比例分布,其中每个扇形代表不同任务执行情况的比例,直观地显示了已完成任务和未完成任务在总任务中的占比。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “商会” 获取。👈👈👈

玫瑰图:展示了前15个任务的标价在极坐标系下的分布。

通过玫瑰图分析,展示了前15个任务的标价在极坐标系下的分布,每个扇形的角度和半径分别表示任务的编号和标价。

箱线图:展示了前15个会员的信誉值分布情况。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “商会” 获取。👈👈👈

相关文章
|
1天前
|
机器学习/深度学习 数据挖掘 大数据
大数据时代的“淘金术”:Python数据分析+深度学习框架实战指南
在大数据时代,数据被视为新财富源泉,而从海量信息中提取价值成为企业竞争的核心。本文通过对比方式探讨如何运用Python数据分析与深度学习框架实现这一目标。Python凭借其强大的数据处理能力及丰富库支持,已成为数据科学家首选工具;而TensorFlow和PyTorch等深度学习框架则为复杂模型构建提供强有力的技术支撑。通过融合Python数据分析与深度学习技术,我们能在各领域中发掘数据的无限潜力。无论是商业分析还是医疗健康,掌握这些技能都将为企业和社会带来巨大价值。
15 6
|
8天前
|
数据采集 传感器 数据可视化
利用Python进行数据分析与可视化
【9月更文挑战第11天】在数字化时代,数据已成为企业决策和科学研究的关键。本文将引导读者了解如何使用Python这一强大的工具进行数据分析和可视化,帮助初学者理解数据处理的流程,并掌握基本的可视化技术。通过实际案例,我们将展示如何从原始数据中提取信息,进行清洗、处理,最终以图形方式展现结果,使复杂的数据变得直观易懂。
|
8天前
|
机器学习/深度学习 数据可视化 数据挖掘
深入浅出:使用Python进行数据分析的入门指南
【9月更文挑战第11天】本文旨在为初学者提供一条清晰的道路,通过Python探索数据科学的奇妙世界。我们将从基础语法讲起,逐步深入到数据处理、可视化以及机器学习等高级话题。文章不仅分享理论知识,还将通过实际代码示例,展示如何应用这些知识解决实际问题。无论你是编程新手,还是希望扩展技能的数据分析师,这篇文章都将是你宝贵的资源。
|
1天前
|
机器学习/深度学习 数据挖掘 TensorFlow
解锁Python数据分析新技能,TensorFlow&PyTorch双引擎驱动深度学习实战盛宴
在数据驱动时代,Python凭借简洁的语法和强大的库支持,成为数据分析与机器学习的首选语言。Pandas和NumPy是Python数据分析的基础,前者提供高效的数据处理工具,后者则支持科学计算。TensorFlow与PyTorch作为深度学习领域的两大框架,助力数据科学家构建复杂神经网络,挖掘数据深层价值。通过Python打下的坚实基础,结合TensorFlow和PyTorch的强大功能,我们能在数据科学领域探索无限可能,解决复杂问题并推动科研进步。
9 0
|
4月前
|
机器学习/深度学习 存储 数据可视化
数据分享|Python在Scikit-Learn可视化随机森林中的决策树分析房价数据
数据分享|Python在Scikit-Learn可视化随机森林中的决策树分析房价数据
|
4月前
|
传感器 数据可视化 BI
python研究汽车传感器数据统计可视化分析
python研究汽车传感器数据统计可视化分析
|
4月前
|
自然语言处理 数据可视化 数据挖掘
数据代码分享|Python对全球Covid-19疫情失业数据相关性、可视化分析
数据代码分享|Python对全球Covid-19疫情失业数据相关性、可视化分析
|
4月前
|
数据可视化 数据处理 索引
Python用GARCH对ADBL股票价格时间序列趋势滚动预测、损失、可视化分析
Python用GARCH对ADBL股票价格时间序列趋势滚动预测、损失、可视化分析
|
4月前
|
新零售 分布式计算 数据可视化
数据分享|基于Python、Hadoop零售交易数据的Spark数据处理与Echarts可视化分析
数据分享|基于Python、Hadoop零售交易数据的Spark数据处理与Echarts可视化分析
|
数据可视化 数据挖掘 Python
python可视化数据分析开心麻花影视作品分析词云折线图等源码
python可视化数据分析开心麻花影视作品分析词云折线图等源码
232 0