数据不是新的石油或数字经济的基础设施

简介: 有人声称数据是“新的石油”。有人声称数据是基础设施。这两个断言都是错误的。

世界充满了数据。在2017年的每一分钟里,美国人使用超过260万千兆字节的数据,天气频道收到超过1800万的预测请求。YouTube观看者观看了超过400万的视频。推特用户发送了超过44.6万条推文。谷歌进行了超过360万次的搜索。


全球90%以上的数据是在过去两年中创造的——每天超过2.5个五万亿字节的数据。随着物联网在日常物品的传感设备中收集的数据越来越多,数据量将只增不减。


所有这些数据带动了数字经济,使我们生活的方方面面都更丰富,更多彩,更有趣,更富有成效。在当今的全球信息经济中,我们离不开它。


为了强调数据对数字经济做出的这一独特的贡献,很多评论家已经开始将数据称为新的石油。 例如,《经济学人》把数据描述为“数字时代的石油”。但正如欧洲监管中心所说,这种“数据和石油之间的常见类比是具有误导性的”。


它们之间有什么区别呢?数据可以反复使用。它不会一次性用完。一家公司可能会使用2017年1月17日的收盘价的道琼斯平均指数来评估埃及的政治风险;另一种算法将其用于情感分析,第三种算法可以用来作为推出新产品或服务的营销计划的输入。


相反,石油是有限的有形物质。使用它一度意味着用光它;它被提炼、加工、燃烧,然后消失。人们上班所使用的一加仑汽油不能再用来让他们回家。


此外,石油和信息的不同之处在于它们在隔离和控制上的难易程度。石油的有形物理性质意味着它很容易受到控制,并排除其他人使用它。


但是信息不是那样的。很多有价值的数据集随处可得。例如,公众可以轻松地访问在线商家收取的价格,任何想要设计定价算法的人都可以使用这些信息。Fitbit可以访问用户的身体信息,但是它不能阻止他们使用另外一种可以测量他们锻炼模式的设备。


企业有时可能会使用技术,法律和合同方面的障碍来阻止人们访问他们收集的数据,但这些信息往往可以从其它来源收集。宽带提供商和银行不会让其他人从他们的数据库中提取客户的电子邮件地址。但用户可以将这些信息提供给很多其它的公司和机构。


用户通常使用同一服务的多个提供者。据德勤称,81%的用户使用多种在线购物服务,74%的用户使用多个在线新闻提供者,72%的用户使用多种在线旅游服务,70%的用户使用多种电子邮件,即时消息或视频通话服务。这些替代供应商可以获取有关其客户的非常相似的行为和偏好数据。


《经济学人》在经济观点上非常老练,它承认数据不存在竞争,但他们认为这只对一些隐私保护的传统版本的挑战。更深远的意义在于经济:数据的不可穷尽性和非排他性意味着竞争对手可以收集和使用他们参与竞争时所需要的数据。


数据集的充足供应和可复制性也颠覆了数据是新基础设施的想法。例如,经济合作与发展组织(OECD)认为应该将数据视为“达到多个目的的共享手段”,因为广泛的生产活动“需要”数据作为投入。


但是出于同样的原因,数据不是石油,不是基础设施。丰富的有价值的数据通常可用于公共用途。此外,没有数据集是必不可少的。总是有替代数据集可以复制专有数据的经济职能。


有些物理设施,如道路、水和电力供应必须共享,因为它们对于社会中的人们和组织想做的任何事情都是必不可少的。互联网本身以及支持互联网的物理通信渠道都是如此。但是因使用互联网产生的数据集以及位于其上方的应用程序并不是这样的。它们本身并不是基本的基础设施的一部分。数据是沿着通信信道流动的流量,但它本身不是通信信道。


数据无处不在。它是丰富的,不是稀缺的。数字经济离不开它。但它不是石油,也不是基础设施。

相关文章
|
存储 缓存 NoSQL
深入理解Django与Redis的集成实践
深入理解Django与Redis的集成实践
591 0
|
2月前
|
传感器 数据采集 数据可视化
基于STM32的智能家居控制系统设计
基于STM32的智能家居控制系统设计
458 10
|
设计模式 前端开发 JavaScript
自动化测试框架设计原则与最佳实践####
本文深入探讨了构建高效、可维护的自动化测试框架的核心原则与策略,旨在为软件测试工程师提供一套系统性的方法指南。通过分析常见误区,结合行业案例,阐述了如何根据项目特性定制自动化策略,优化测试流程,提升测试覆盖率与执行效率。 ####
527 6
|
机器学习/深度学习 编解码 算法
《探秘目标检测算法:YOLO与Faster R-CNN的原理及发展之旅》
目标检测是计算机视觉的重要任务,旨在识别图像或视频中的目标及其类别。早期依赖滑动窗口和人工特征(如HOG、SIFT),结合SVM等分类器,但计算量大、精度有限。随着深度学习兴起,R-CNN系列(R-CNN、Fast R-CNN、Faster R-CNN)逐步引入CNN和区域提议网络(RPN),显著提升速度和精度。YOLO系列(v1-v8)将检测视为回归问题,直接预测边界框和类别,以速度快著称。近年,基于Transformer的DETR等模型崭露头角,利用自注意力机制捕捉全局信息。未来,目标检测将在精度、速度和泛化能力上取得更大突破。
807 16
|
存储 供应链 安全
区块链技术在选举中的应用:透明与安全的新时代
区块链技术在选举中的应用:透明与安全的新时代
621 16
|
存储 缓存 测试技术
一种提高Unixbench测试分数的方法
一种提高Unixbench测试分数的方法
3780 0
一种提高Unixbench测试分数的方法
|
SQL 监控 数据库
OceanBase社区版可以通过Zabbix监控
OceanBase社区版可以通过Zabbix监控
551 7
|
JavaScript 安全 前端开发
掌握Deno:新一代安全的JavaScript和TypeScript运行时
【10月更文挑战第15天】Deno是由Node.js创始人Ryan Dahl发起的新一代JavaScript和TypeScript运行时,旨在解决Node.js的设计问题,提供更安全、现代的开发体验。本文介绍Deno的核心特性、优势及使用方法,包括安全性、统一的运行时、现代Web标准和内置工具等,帮助开发者快速上手Deno,适用于Web开发、工具开发和教育等领域。
|
监控 小程序 前端开发
小程序全栈开发中的WebSocket实时通信实践
【10月更文挑战第3天】随着移动互联网的发展,小程序因便捷的用户体验和社交传播能力,成为企业拓展业务的新渠道。本文探讨了小程序全栈开发中的WebSocket实时通信实践,包括其实时通信、长连接及双向通信的特点,并通过实时聊天、推送、游戏和监控等功能的实现,展示了WebSocket在小程序中的应用。开发者需注意安全性、性能及兼容性等问题,以保障小程序的稳定运行和用户体验。
391 7
|
机器学习/深度学习 算法 数据可视化
skimage
【9月更文挑战第30天】
409 2

热门文章

最新文章