数据过于完美就是造假?too sample,GDP数据更加完美!

简介: 数据过于完美就是造假?too sample,GDP数据更加完美!

这两天,天猫双十一交易额造假的事情持续发酵,因为曲线过于完美,所以受到了很多人的质疑。甚至有些人还用 Python 进行了拟合运算,最终的拟合结果和天猫发布的数据非常吻合,进而甚至已经预测出了明年双十一的预期交易金额,这可真的是出其不意,天外飞瓜啊!

下图就是通过多项式拟合得到的曲线,看起来还真是完美呢

不过天猫官方也出面澄清了:数据造假?没!必!要!哈哈哈,这真的是个门外吃瓜群众难以分辨的事情。

那么是否真的是当数据完美符合某种数学公式时,就会存在人为干涉的情况呢。

既然我们一时之间难以分辨天猫数据的真假,那么我们可以使用其他的数据来验证下呀,比如 GDP!这个数据可是代表着一个国家经济实力的重要指标,当年我国 GDP 超越邻居的时候,还狠狠的自豪了一把呢!

那么如果我们把某些国家的历年 GDP 数据也通过相同的方式进行拟合,如果也得出完美的曲线,哎呀,不敢想,有点小激动!

我们暂且就把这种拟合曲线叫做“天猫曲线”吧,谁让它体量大,影响度强呢!

数据整理

我们现在手中有一份全球各国历年 GDP 的数据文件,先来查看下2018全球 GDP 总量排行前几名

我们就以前五名为研究对象吧,看看他们的 GDP 总量的分布情况是怎样的

各国GDP历年数据曲线

这前五个国家,就依次排列吧

美国

中国

日本

德国

英国

这一圈看下来啊,貌似符合“天猫曲线”的,就是前两位的美国和我国了,那么就开始拟合吧。

数据拟合

关于“天猫曲线”的拟合过程,已经有好多教程写了,无非就是多项式回归,强大的 Python 完全搞得定,我们直接来看结果

没有任何问题,完美符合“天猫曲线”,难道说,美国的 GDP 是?哈哈哈哈,我们再来看看再符合该曲线的情况下,2019年美国的 GDP 总量应该是

20.75 万亿美元

是非成败,我们等到2019年的 GDP 数据出炉的时候再说吧。

下面再来看看我们国家的GDP曲线情况

没有任何意外,同样比较符合多项式回归曲线!如果再预测2019年的 GDP 的话,应该会是

14.88 万亿美元

现在我们已经得到了世界上 GDP 总量最高的两个国家的走势曲线,竟然都惊奇的符合多项式归回,是不是能够说明一些问题呢。

萝卜说


我们都应该都知道,很多数学公式的出现与创造,都是自然科学规律的积累,比如我们常见的正态回归,就是因为在我们的生活中有太多的现象、数据拥有同样的规律走势,所以前辈们才发现总结了对应的公式定律,用于统一描述这类数据。所以当我们看到身边的某些数据是符合正态回归形式的时候,都没有太多的惊讶。

而此时,我们先是发现了天猫双十一的交易金额符合多项式归回,现在又对比美国和我国的 GDP 总量数据,也是符合多项式归回的,而且两者都可以归结为经济类数据,且都可以在一定方面反映出这个国家的经济水平。那么我们是不是可以大胆的推测下,双十一天猫交易金额,正是我国 GDP 总量在国内消费水平上的某种体现呢。而且从其他几个国家的增长曲线能够看出,当国家的经济出现大的波动时,曲线就没有那么平滑了,比如日本、德国等,都是在大幅增长之后,出现了不同程度的退步,而在维持经济平稳发展上来说,我国和美国无疑是做的最好的两个国家了。

哇咔咔,不是专业搞经济的,不敢也不会说的多么深入,但是无论怎样,数据在这里,有一点是可以肯定的,国家的GDP总量在增长,人们的总体生活水平就会有所提升,那么消费水平也会相应的提升,至于它们之间是否有某种特殊的关联,就留给经济学家去操心吧!

相关文章
|
5月前
|
编解码 定位技术 数据格式
中国GDP空间分布数据集【转】
这是一个关于中国GDP空间分布公里网格数据集的摘要:该数据集基于县一级的GDP统计,结合土地利用、夜间灯光和居民点密度,通过空间插值生成1995年至2019年的6期1公里分辨率的栅格数据。每个栅格表示1平方公里内的GDP总值(万元/平方千米),采用Krassovsky椭球和Albers投影。数据引用需注明来源及数据论文,参考了多种GDP空间化的研究方法。数据覆盖全国,格式为tif,坐标系为WGS 1984。
|
6月前
|
资源调度
stata马尔可夫Markov区制转移模型分析基金利率
stata马尔可夫Markov区制转移模型分析基金利率
|
6月前
Google Earth Engine(GEE) ——世界人口网格化第4版行政单位中心点与人口数据集
Google Earth Engine(GEE) ——世界人口网格化第4版行政单位中心点与人口数据集
98 1
|
编解码 分布式计算 算法
PIE-Engine提取山东冬小麦种植分布
PIE-Engine提取山东冬小麦种植分布
158 0
|
编解码 BI 定位技术
自然保护区边界数据(国家级、省级、县市级)/乡镇区划边界/村界/植被类型分布/土地利用数据/NPP数据/NDVI数据
自然保护区边界数据(国家级、省级、县市级)/乡镇区划边界/村界/植被类型分布/土地利用数据/NPP数据/NDVI数据
自然保护区边界数据(国家级、省级、县市级)/乡镇区划边界/村界/植被类型分布/土地利用数据/NPP数据/NDVI数据
|
JSON 数据格式
PIE-Engine:广东省生态遥感指数RSEI研究2
PIE-Engine:广东省生态遥感指数RSEI研究2
236 0
PIE-Engine:广东省生态遥感指数RSEI研究2
Crawl:利用bs4和requests爬取了国内顶级某房源平台(2020年7月2日上海二手房)将近30*100多条数据并进行房价分析以及预测
Crawl:利用bs4和requests爬取了国内顶级某房源平台(2020年7月2日上海二手房)将近30*100多条数据并进行房价分析以及预测
Crawl:利用bs4和requests爬取了国内顶级某房源平台(2020年7月2日上海二手房)将近30*100多条数据并进行房价分析以及预测
|
数据挖掘 Shell 定位技术
Google Earth Engine——USGS GAP CONUS 2011GAP/LANDFIRE国家陆地生态系统数据代表了美国本土、阿拉斯加、夏威夷和波多黎各的详细植被和土地覆盖分类
Google Earth Engine——USGS GAP CONUS 2011GAP/LANDFIRE国家陆地生态系统数据代表了美国本土、阿拉斯加、夏威夷和波多黎各的详细植被和土地覆盖分类
116 0
Google Earth Engine——USGS GAP CONUS 2011GAP/LANDFIRE国家陆地生态系统数据代表了美国本土、阿拉斯加、夏威夷和波多黎各的详细植被和土地覆盖分类
|
数据挖掘 Shell 定位技术
Google Earth Engine——USGS GAP CONUS 2011GAP/LANDFIRE国家陆地生态系统数据代表了美国本土、阿拉斯加、夏威夷和波多黎各的详细植被和土地覆盖分类。
Google Earth Engine——USGS GAP CONUS 2011GAP/LANDFIRE国家陆地生态系统数据代表了美国本土、阿拉斯加、夏威夷和波多黎各的详细植被和土地覆盖分类。
119 0
Google Earth Engine——USGS GAP CONUS 2011GAP/LANDFIRE国家陆地生态系统数据代表了美国本土、阿拉斯加、夏威夷和波多黎各的详细植被和土地覆盖分类。
|
API
Google Earth Engine——美国人口普查局的TIGER数据集包含美国主要政府部门的2016年边界。除了50个州之外,人口普查局还将哥伦比亚特区、波多黎各和每个岛屿地区
Google Earth Engine——美国人口普查局的TIGER数据集包含美国主要政府部门的2016年边界。除了50个州之外,人口普查局还将哥伦比亚特区、波多黎各和每个岛屿地区
148 0
Google Earth Engine——美国人口普查局的TIGER数据集包含美国主要政府部门的2016年边界。除了50个州之外,人口普查局还将哥伦比亚特区、波多黎各和每个岛屿地区