《社会调查数据管理——基于Stata 14管理CGSS数据》一2.2 数据管理的工作标准

简介:

本节书摘来自异步社区《社会调查数据管理——基于Stata 14管理CGSS数据》一书中的第2章,第2.2节,作者 唐丽娜,更多章节内容可以访问云栖社区“异步社区”公众号查看

2.2 数据管理的工作标准

对社会调查数据而言,数据管理工作从调查工作启动之日开始。调查数据来源于社会调查,社会调查是生产数据的一种重要工具。数据管理的最终目标是确保数据质量。高质量数据有两个基本判断标准:真实、有效,即数据尽量接近事实(真实性),且能为研究所用(有效性)。为此,数据管理工作至少要满足以下6个基本要求。

1.目标清晰
上面提到,数据管理贯穿整个社会调查全程,不仅历时长,且任务杂。在这种情况下,每一阶段、每一步的管理目标都要明确清晰,以便管理工作的分配和管理人员的安排,否则容易出现漏做、重做等问题,影响数据质量。

2.任务可行
确定目标后,接下来要做的工作就是把目标分解成各级任务。数据管理者一定要注意:任务可以是不完美的,但一定要可行。在数据管理过程中,常见的一种困境是:任务明确,但不具备可操作性。舍弃“完美主义”,在现有的时间、资金、人力等资源条件下,尽可能好地完成任务。同理,在这个世界上很难找出没有问题的社会调查,找不到能完全真实反映社会现实的数据,一切社会调查所得的数据都只能是无限接近事实。

3.流程简易
目标和任务确定后,接下来要考虑到工作流程。制定工作流程的基本标准:简易。越复杂的工作流程,越容易出错。在某一项具体的数据管理工作中,参与的人员越多,工作流程的制定就越简易,因为对不同的人而言,简易的标准不一样,如同样的事情,能用常见软件完成,就不要用小众软件,如果采用小众软件,不仅给合作者带来很多负担和学习压力,而且会增加出错的可能性。

4.职责明确
目标不会自动实现,任务不会自动完成,流程不会自动走完,事情最终是由人来完成的,再完美的工作计划如果没有合适的人承担,那它几乎就等于零。任何一项数据管理工作都不可能由一个人单独完成,后面会讲到“双录”“双校”,任何一项和数据管理有关的工作,都尽量保证由两个人独立完成,并做事后校验。 在大型数据管理项目中,整个工作流程类似工业生产的生产线,环环相扣,每个环节的工作人员都要清楚地知道自己的权限和职责,否则一环出错,整个流程就会崩溃。比如:通常,数据编码手册在问卷设计时就要考虑到,而且问卷一旦确定,数据编码手册也就基本定型。数据清理员在拿到原始数据之后,必须要对照数据编码手册对每个变量逐一进行检验。

5.标准统一
在大型数据管理中,标准统一极其重要。只有用同一标准管理的数据,才有可能进行合并,“外人”才有可能读懂数据。数据管理的忌讳是:标准不一,朝令夕改。假设有一个关于健康的、5年的追踪调查,体重这个变量在第一年的数据中单位是公斤,第二年单位变成斤,第三年也是斤,第四年又变成公斤,第五年也用到公斤。这样,用户使用数据时稍不注意,就有可能直接把5年的体重合并在一起比较。再如,在一个多年的追踪调查中,同一个变量“收入”使用的是不同的变量名:income、incomeyr、perincome等。

6.灵活拓展
好的数据管理工作标准和工作流程应该具备一定的可拓展性。对不同的项目进行数据管理时,可能会用到不同的标准和流程,但没有必要对所有的项目都重新建立一套新的标准和流程,相似的数据管理项目可以互相借鉴,比如:对CGSS2012年的数据管理工作流程进行一定的拓展和修改后,即可用作CGSS2013年的工作流程。再如,中国宗教调查是一个全新的项目,针对这个项目的数据管理就是基于CGSS的数据管理工作流程和内容改出来的,既省时、省力,还行之有效。

在上述标准基础之上,尽量提高管理效率,优化管理流程,实现管理自动化,保证管理标准化。

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
相关文章
|
3月前
|
数据采集 存储 安全
数据治理≠数据管理!90%的企业都搞错了重点!
在数字化转型中,数据不一致、质量差、安全隐患等问题困扰企业。许多组织跳过基础的数据管理,直接进行数据治理,导致方案难以落地。数据管理涵盖数据生命周期中的采集、存储、处理等关键环节,决定了数据是否可用、可靠。本文详解数据管理的四大核心模块——数据质量、元数据、主数据与数据安全,并提供构建数据管理体系的四个阶段:评估现状、确定优先级、建立基础能力与持续改进,助力企业夯实数据基础,推动治理落地。
|
7月前
|
存储 数据管理 数据格式
数据治理 vs. 数据管理:别再傻傻分不清!
数据治理 vs. 数据管理:别再傻傻分不清!
392 10
|
3月前
|
数据采集 存储 SQL
数据管理四部曲:元数据管理、数据整合、数据治理、数据质量管控
老张带你搞定企业数据管理难题!数据找不到、看不懂、用不好?关键在于打好元数据管理、数据整合、数据治理和数据质量管控四大基础。四部曲环环相扣,助你打通数据孤岛,提升数据价值,实现精准决策与业务增长。
数据管理四部曲:元数据管理、数据整合、数据治理、数据质量管控
|
5月前
|
数据采集 人工智能 监控
企业数据来源杂、质量差,如何通过主数据管理解决?如何确保数据可信、一致和可用?
本文三桥君系统介绍了主数据管理(MDM)在企业数字化转型中的关键作用。产品专家三桥君从数据清洗、治理、处理到流转四个维度,详细阐述了如何通过标准化流程将数据转化为企业核心资产。重点包括:数据清洗的方法与工具应用;数据治理的组织保障与制度设计;数据处理的三大核心动作;以及数据流转的三种模式与安全控制。专家三桥君强调主数据管理能够推动企业从"经验决策"转向"数据驱动",并提出构建统一数据服务网关、"数据血缘图谱"等实战建议,为企业数字化转型提供系统化解决方案。
230 0
|
人工智能 关系型数据库 分布式数据库
拥抱Data+AI|“全球第一”雅迪如何实现智能营销?DMS+PolarDB注入数据新活力
针对雅迪“云销通App”的需求与痛点,本文将介绍阿里云瑶池数据库DMS+PolarDB for AI提供的一站式Data+AI解决方案,助力销售人员高效用数,全面提升销售管理效率。
|
关系型数据库 分布式数据库 数据库
云栖大会|从数据到决策:AI时代数据库如何实现高效数据管理?
在2024云栖大会「海量数据的高效存储与管理」专场,阿里云瑶池讲师团携手AMD、FunPlus、太美医疗科技、中石化、平安科技以及小赢科技、迅雷集团的资深技术专家深入分享了阿里云在OLTP方向的最新技术进展和行业最佳实践。
|
存储 人工智能 安全
【荣誉奖项】荣获2024数据治理优秀产品!瓴羊Dataphin联合DAMA发布数据管理技能认证
瓴羊Dataphin连续俩年获得DAMA年度优秀数据治理产品奖,本次与DAMA联合发布“DAMA x 瓴羊 数据管理技能认证”,助力提升全民数据素养。
610 0
【荣誉奖项】荣获2024数据治理优秀产品!瓴羊Dataphin联合DAMA发布数据管理技能认证
|
数据采集 安全 数据管理
通信行业数据治理:如何实现高效、安全的数据管理?
在未来的发展中,通信行业的企业应加强数据治理意识,提高数据治理能力;同时,积极开展跨行业的合作创新,共同推动行业的繁荣与发展。相信在不久的将来,通信行业将迎来更加美好的明天。
|
Java 测试技术 容器
从零到英雄:Struts 2 最佳实践——你的Web应用开发超级变身指南!
【8月更文挑战第31天】《Struts 2 最佳实践:从设计到部署的全流程指南》深入介绍如何利用 Struts 2 框架从项目设计到部署的全流程。从初始化配置到采用 MVC 设计模式,再到性能优化与测试,本书详细讲解了如何构建高效、稳定的 Web 应用。通过最佳实践和代码示例,帮助读者掌握 Struts 2 的核心功能,并确保应用的安全性和可维护性。无论是在项目初期还是后期运维,本书都是不可或缺的参考指南。
191 0

热门文章

最新文章