一、背景
当今时代,随着时代的发展,房价问题一直处于风口浪尖,而房地产市场的供给和需求的高度层次性和不同性由于人口、环境、文化、教育、经济等因素的影响,房地产市场在各个区域间的需求情形各不相同,对于需要买房的人来说,在哪里买房,房价怎样,地区地段如何,房价差异以及入手时机,都得自己去一个个查阅与分析,非常麻烦。本项目旨在提取并展示数据,为刚需购房者提供有用信息。
👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 上海二手房分析 ” 获取。👈👈👈
完成六个数据处理任务:
1、上海二手房sh.csv数据的总体房价描述
2、数据清洗和上海二手房单价分布情况
3、上海各城区单价与总价的分布
4、上海各城区房源分析
5、上海房价与房屋面积大小关系
6、上海二手房各维度相关性分析
二、数据分析可视化
2.1.上海二手房总体房价描述
1、读取sh.csv文件,用data变量来接收返回值,表示一个dataframe(2分)
👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 上海二手房分析 ” 获取。👈👈👈
2、随机查看data 的10行数据 和data 的形状(2分)
3、查看data 的总体描述信息 info,并给出说明描述
4、查看data 的数据的范围、大小、波动趋势 describe并描述
面积最小值为21.11,最大值为1831.58,平均值为96.216867。
价格最小值为50w,最大值为11200w,平均值为580.277098w。
随机10行数据和data形状:
👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 上海二手房分析 ” 获取。👈👈👈
2.2 数据清洗和上海二手房单价分布情况
(1)观察数据,从数据总行数、哪些字段存在缺失值、字段的数据类型三个维度简要描述
(2)重命名字段,原来的字段名是中文,为了方便处理,统一转换成英文,对应关系如下所示:
{'小区名字':'name','户型': layout,'面积':'area','区域':'district','楼层':'floorlevel','朝向':'dire','价格(W)':'price','单价(平方米)':'unit_price','建筑时间':'buildtime'}
👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 上海二手房分析 ” 获取。👈👈👈
(3)户型 和 楼层 两个字段需要分别拆分为两个字段存储,户型拆成室和厅,室用living_rooms表示,厅用sitting_rooms表示;楼层拆成区间和层,区间用floor_level表示,层用floor表示,然后分别添加到data末尾,然后打印前五行或其它方法验证。
(4)“建筑时间”字段类型为object,需要提取年份部分,并存储为timestamp类型;(5分)
👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 上海二手房分析 ” 获取。👈👈👈
(5)找出data重复的数据并删除,缺失值分布bool类型,统计每列缺失值个数,然后使用上一个非缺失值填充。
👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 上海二手房分析 ” 获取。👈👈👈
(6)输出异常数据(单价大于20万),并把它们删除
(7)找出单价最高的记录和最低的记录,并计算他们单价相差多少
(8)作图。画出上海二手房单价分布的箱线图,并作出简要的描述。(3分)
👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 上海二手房分析 ” 获取。👈👈👈
2.3上海各城区单价与总价的分布
1、各个城区单价分布箱线图、各个城区总价分布箱线图。(10分)
👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 上海二手房分析 ” 获取。👈👈👈
2、计算上海每平方米平均单价和购买一套房平均总价是多少,保留两位小数(10分)
def calculate_and_print_averages(data): average_unit_price = data['unit_price'].mean() average_total_price = data['price'].mean() print(f"上海每平方米平均单价: {average_unit_price:.2f}元") print(f"购买一套房的平均总价: {average_total_price:.2f}万元")
运行结果:
2.4.上海各城区房源分析(10分)
1、统计各城区房源数量分布条形图,并在条形图上方标注对应的数值
👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 上海二手房分析 ” 获取。👈👈👈
2.5. 上海房价与房屋面积大小关系
1、上海房价与房屋面积大小的关系如何,使用散点图表示并作出说明(5分)
2、上海二手房各维度相关性分析(5分)
👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 上海二手房分析 ” 获取。👈👈👈
2.6. 输出文件
1、把清洗好的data输出成一个excel文件,命名为上海二手房.xlsx。
2、按照城区输出各个清洗好的excel数据,使用城区命名sheet,并命名上海二手房分区统计.xlsx,如下图所示。
👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 上海二手房分析 ” 获取。👈👈👈