开发者社区> 问答> 正文

数据有问题? checkintimeflighttime


遇到下面问题,这条数据 checkin_time > flight_time,咋回事?哪位解释下。

+-------------+---------+------------------+------------------+
|passenger_ID2|flight_ID|       flight_time|      checkin_time|
+-------------+---------+------------------+------------------+
| 1.76214525E8|   CZ3249|2016/9/11 06:35:00|2016/9/11 07:16:00|

展开
收起
xueba207 2016-09-30 14:41:50 4434 0
2 条回答
写回答
取消 提交回答
  • Re数据有问题? checkintimeflighttime
    有2万多行呢,这次的数据质量真让人伤脑筋
    2016-09-30 20:05:24
    赞同 展开评论 打赏
  • Re数据有问题? checkintimeflighttime
    的确有极少量的这类矛盾记录存在,机场数据系统原数据就是如此。建议选手按照脏数据对待。

    -------------------------

    回 2楼wellington的帖子
    是的,数据工作往往是在和问题数据搏斗。
    这次的数据使用反映出机场在数据治理上有很多可改进的地方,这也是为什么机场出钱让我们来推敲的原因么。
    2016-09-30 15:31:47
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
数据无边界:非结构化数据在MaxCompute上的处理 立即下载
数据无边界:非结构化数据在MaxCompute上的处理 立即下载
交易风控数据的海量存储于实时访问 立即下载

相关实验场景

更多