【法语译文】法国如何在大数据时代担当重要角色

简介:

大数据革命如火如荼,法国如何才能抓住其中每一个机遇?G9+研究院和数字复兴协会的智囊团提出了6项具体建议。


互联设备的增长使得个人数据的存储在各行各业中(电信运营商,银行,保险,工业,物流,交通运输等)加速发展。这些设备中产生的数据,无论是来自大型集团还是其它公司,都可以建立起前所未有的大数据集合。这些数据凭借其数据量,准确性,丰富性和范围广度,将成为众多的的深度分析的来源,并且为数据提炼的应用程序或服务提供了交叉数据分析的可能性。


在以马克·安德森所描述的“吞食世界”的方式,大规模集中体现于软件开发之后,全球经济的价值观趋向于一个新的拐点。它除了分析的形式更为健全之外,更重要的是世界范围内数据所有权的制度更为完善。这种关于谁将控制数据的运动将在全球经济价值链中和企业的商业模式中引起巨大动荡,甚至超过专家的分析预期。


机遇与风险

在一个如此数据化的世界,数学、统计、编程是否会成为新的必不可少的基础现代语言?我们对于国家在教育导向和基础设施投资上该有哪些期待呢?


机遇之外,无孔不入的大数据又将给我们的隐私、自由意志和个人选择带来什么样的风险?而用于大数据的谨慎预防原则看起来又会让这个拥有巨大潜力的新市场停滞不前。这里我们提出能够让法国成为大数据革命的领导者的六条建议。


建议1:部署为期三年的大数据技术测试计划,用于一些公共政策领域以产生直接的经济效益:例如,打击医疗保险欺诈行为,或者某些公共卫生政策的管理。当然这些机构必须得到CNIL(国家信息和自主权委员会)的特许。这些举措将促进拥有技术的初创企业和拥有数据的大型集团之间的合作,使整个大数据生态系统更为活跃。


建议2:提出一项关于开放数据的法律,以迫使政府的战略管理部门开放直接关系到“人的生命,健康和财产”的事件数据和统计数据。政府可将其公布在法国国家公共数据的门户data.gouv.fr这个平台上。重要的是要在该项法案中列入数据的免费获取权。现行的法案(1978年7月法第15条,2003年更新)规定公众数据的获取可以是有偿的。这种财务上的便利能让初创公司的生态系统更有活力,并且抑制集团企业从中牟利。


建议 3:提供并发展可以覆盖整个大数据行业链的培训。


建议4:充分利用法国在数学、统计和电信方面的优势,让其在联合科研项目以及在联合研究中心发挥交叉学科带来的更大作用。


建议5:在法国政府与欧洲议会、欧洲国家信息和自主权委员会之间发起一场关于大数据监管发展的辩论,并且逐渐形成欧洲统一监管方案,使得欧洲的创新企业可以从市场中受益。算法时代做出决策的道德规范,乃至关于数据处理和交互使用过程中的监管问题都涉及到政府与民间社会的利害关系,必须慎重对待。


建议6:建立获得认证的监管机构对算法的审计核查制度,以确保企业及政府机构对个人隐私的保护。这也使得大数据监管的重点将放在如何使用数据,而非如何收集数据上。


通过以往的技术革命,人们已总结出该如何制定并执行这些监管,所以我们相信对大数据使用的监管是可以做到的,这不过是一个时间问题以及学习的过程。至于谈到数据将决定一切这种极端言论,让我们记住,人类智慧并不依赖于大数据。好比汽车的发明不过是骑马的人可预见的需求,又如iPad是应个人电脑用户要求而推出的。在这个数据实时被揭露的时代,我们认为人类的判断力、经验和创造力将更为关键,也更加不同凡响。


作者:LucBretones / G9+研究院副院长;

Guillaume Buffet / 数字复兴协会会长

摘自:法国《回声报》

原文链接:http://www.lesechos.fr/idees-debats/cercle/0204027187872-comment-faire-de-la-france-un-acteur-majeur-du-big-data-1076479.php#


【译者简介】

吴涤,本科毕业于上海外国语大学法语系,硕士毕业于法国巴黎二大(UniversitéPanthéon-Assas),主修统计与金融工程专业。目前旅居巴黎,就职于法国第二大银行集团,担任决策分析工程师,对于金融领域的数据挖掘、决策建模与商业分析有扎实的理论基础与丰富的实践经验。对于大数据的发展,尤其在金融领域的应用有浓厚的兴趣。


2014年底正式加入大数据文摘海外翻译志愿者行列,希望在新的一年带领大家近距离观察法国,乃至欧洲在大数据时代的动向。衷心祝愿文摘成为读者最喜爱的大数据知识信息分享平台。


原文发布时间为:2015-01-18

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
分布式计算 Hadoop 大数据
Jupyter 在大数据分析中的角色
【8月更文第29天】Jupyter Notebook 提供了一个交互式的开发环境,它不仅适用于 Python 编程语言,还能够支持其他语言,包括 Scala 和 R 等。这种多语言的支持使得 Jupyter 成为大数据分析领域中非常有价值的工具,特别是在与 Apache Spark 和 Hadoop 等大数据框架集成方面。本文将探讨 Jupyter 如何支持这些大数据框架进行高效的数据处理和分析,并提供具体的代码示例。
426 0
|
存储 分布式计算 大数据
数据仓库与数据湖在大数据架构中的角色与应用
在大数据时代,数据仓库和数据湖分别以结构化数据管理和原始数据存储见长,共同助力企业数据分析。数据仓库通过ETL处理支持OLAP查询,适用于历史分析、BI报表和预测分析;而数据湖则存储多样化的原始数据,便于数据探索和实验。随着技术发展,湖仓一体成为趋势,融合两者的优点,如Delta Lake和Hudi,实现数据全生命周期管理。企业应根据自身需求选择合适的数据架构,以释放数据潜力。【6月更文挑战第12天】
594 5
|
消息中间件 分布式计算 Kafka
MaxCompute 在实时数据分析中的角色
【8月更文第31天】随着大数据应用场景的不断扩展,对数据处理速度的要求越来越高,传统的批处理模式已经难以满足某些业务对实时性的需求。在这种背景下,实时数据处理成为了大数据领域的研究热点之一。阿里云的 MaxCompute 虽然主要用于离线数据处理,但通过与其他实时流处理系统(如 Apache Flink 或 Kafka Streams)的集成,也可以参与到实时数据分析中。本文将探讨 MaxCompute 在实时数据分析中的角色,并介绍如何将 MaxCompute 与 Flink 结合使用。
360 0
|
存储 分布式计算 资源调度
ODPS SQL问题之ODPS逻辑层包含哪些角色,它们各自的功能是什么
ODPS SQL 问题之ODPS逻辑层包含哪些角色,它们各自的功能是什么
239 0
|
分布式计算 自然语言处理 DataWorks
MaxCompute产品使用合集之在DataWorks中,当涉及到MC的投递功能时,所指的自定义RAM角色是什么
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
197 0
|
消息中间件 大数据 Kafka
Kafka与大数据:消息队列在大数据架构中的关键角色
【4月更文挑战第7天】Apache Kafka是高性能的分布式消息队列,常用于大数据架构,作为实时数据管道汇聚各类数据,并确保数据有序传递。它同时也是数据分发枢纽,支持多消费者订阅,简化系统集成。Kafka作为流处理平台的一部分,允许实时数据处理,满足实时业务需求。在数据湖建设中,它是数据入湖的关键,负责数据汇集与整理。此外,Kafka提供弹性伸缩和容错保障,适用于微服务间的通信,并在数据治理与审计中发挥作用。总之,Kafka是现代大数据体系中的重要基础设施,助力企业高效利用数据。
752 1
|
机器学习/深度学习 SQL 分布式计算
MaxCompute产品使用合集之要撤销一个开发角色对某个表的查询权限,具体的操作步骤是什么
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
存储 分布式计算 数据可视化
开源在大数据和分析中的角色
开源在大数据和分析中的角色
158 0
|
分布式计算 DataWorks MaxCompute
MaxCompute中如何通过policy 禁止角色的删除权限
Policy授权则是一种基于主体的授权。通过Policy授权的权限数据(即访问策略)被看做是授权主体的一种子资源。只有当主体(用户或角色)存在时才能进行Policy授权操作。当主体被删除时,通过Policy授权的权限数据会被自动删除。 Policy授权使用MaxCompute自定义的一种访问策略语言来进行授权,允许或禁止主体对项目空间对象的访问权限。Policy授权机制,主要解决ACL授权机制无法解决的一些复杂授权场景。
1228 0
MaxCompute中如何通过policy 禁止角色的删除权限
|
数据采集 分布式计算 大数据
数道云解析:基于Hadoop集群环境的数据采集和舆情监测技术分析,Hadoop在大数据平台搭建中扮演着何种角色?
基于Hadoop集群环境的数据采集系统,利用分布式网络爬虫进行数据抓取,以HDFS作为底层存储系统,在其上构建基于HBase的分布式数据库对数据进行统一存储管理。然后根据采集的数据,通过检索的形式分类数据,进行一个深层次的数据分析工作。
1891 0