“数据”一词 早出现在拉丁语中,含义是“给予的事物”,后来其随着数学和神学进入英语。随着经济社会的发展和技术的进步,出现了很多关于数据的不同认识和定义。 1.联合国欧洲经济委员会(the United Nations Economic Commission for Europe,UNECE)将数据定义为信息的实体表现形式,这一表现形式适用于人工或自动化手段交流、转译或处理。 2.美国国际空间数据系统咨询委员会(Consultative Committee for Space Data Systems,CCSDS)给出的数据定义是以适合于交流、解释或加工的形式化方式进行的可重新解释的信息表示形式。比特序列、数值表、页面中的字符、讲话录音、月球岩石标本等都是数据。 3.国际数据管理协会(DAMA International)认为数据是以文本、数字、图形、图像、声音和视频等格式对事实进行表现的形式,是信息的原始材料。 4.曾任国际科学理事会(International Science Council,ISC)信息和数据战略协调委员会(Strategic Coordinating Committee on Information and Data,SCCID)成员的彼得·福克斯(Peter Fox)和瑞·海瑞斯(Ray Harris)认为数据至少包括数字观测、科学监控、传感器数据、元数据、模型输出和场景、定性或观察的行为数据、可视化数据、出于行政或商业目的而收集的统计数据;数据通常被视为研究过程的输入。 5.2019 年美国《开放的、公开的、电子化的及必要的政府数据法案》(The Open, Public, Electronic, and Necessary Government Data Act,简称《开放政府数据法案(The OPEN Government Data Act)》)将数据定义为以任何形式或介质记录下来的信息;开放政府数据时特别指明数据需要满足机器可读的条件。 传统意义上的数据是指数值,例如温度为 26.6℃、长度为 100 m 等,但 IT 领域将数据概念扩大了,数据还包括“Asset”“数据资产”“2020/07/31”等符号、字符、日期形式的数据,以及文本、声音、图形、图像和视频等类型的数据,而且政府文件、出行记录、住宿记录、软件聊天记录、网上购物记录、银行消费记录等也都是数据。
以上摘自《数据资产》,下载地址:https://developer.aliyun.com/ebook/download/7462
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。