Nature:中国的科学进步仰赖于数据公开

简介:

大数据时代,生物信息学数据库的发展、数据共享,以及技术资源的易于访问等特点已经显现。直至最近,这股开放性科学研究的趋势正在帮助中国的科学家们走上国际竞争舞台。然而在整个中国社会,对于公共数据获取和分享的限制正愈演愈烈。如果这个问题不被解决,将会拖慢科学研究与创新。


中国科学家要想获取高质量国内数据正变得越来越困难。大部分的公共数据由政府部门掌握,增强了其垄断地位,使得研究者们获取信息变得更为困难。这对人文社科领域的研究者影响尤甚,同时由于一些数据涉及政治敏感性,也对环境科学、公共健康等领域的研究造成了影响。在会议上,我听到许多同事的抱怨,例如从权威部门获取空气污染数据是如何如何的困难。


即使数据被发布出来,一些数据也很可能因为采集方式上的问题而质量底下。最显著的例子莫过于在国内生产总值(GDP)上的争议。官方的全国性的GDP估值,与将31个省级区域的地方值相加的总和相比,存在极大的差异。北京的国家统计局承认,不同省采用不同的数据采集方式导致了这一结果,而他们正在试图协调这个问题。但至今,进展不容乐观。


公共数据分享已经变成了一种盈利模式。例如,如果采集分析道路车辆对于污染的影响的数据,将会是非常有价值的。然而要完成这一工作,必须能够得到每种型号车辆的牌照数量、道路拥挤情况、发动机参数、燃油标准等详细的数据记录。对于研究机构来说,想要从官方获取最基本的车辆持有辆的信息都十分困难,所以只能退而求其次地使用来自汽车制造商的销售数据,而这样的数据经常是被夸大的、带有误导性的。讽刺的是,财大气粗的汽车制造商们却可以以一定的价格,通过政府相关渠道购买到他们竞争对手的客观可靠的销售数据,这对于科研机构和科学家们来说是负担不起的。


在这样的环境下,中国的一些研究团队不愿意公开他们自己的研究数据也就不奇怪了。掌握数据意味着在学术领域拥有了无形的资本和竞争优势。我自己的研究团队就收到过许多索取海事数据的请求,例如我们所编集的口岸统计数据和船队信息,但我们并不情愿分享这些信息。寻找并将信息分类整理成可用的数据是一个耗费巨大的过程。如果我们独享这些数据,就可以用它开发出自己的研究成果。但要是从其他渠道能获得高质量的数据,我们也会乐意分享我们自己的数据。


开放公共数据,提高数据质量可以促进政府透明。尽管进展缓慢,还是存在公开透明化裨益中国社会的正面例子的。其中最瞩目莫过于2014年环保局迫于公众压力而全面公开披露空气污染数据的例子。在此之前,这类数据只是粗略地每天公布一次。而现在,数据每小时都更新一次并且在国内政府机构之间广泛分享。这些数据使卫生局能够对公众发布警告信息;使教育局可以决定是否因雾霾天停课;使交通运输局能够调整汽车限行政策。或许,全面公开污染信息最大的影响是提高了公众对于日益恶化的污染的危机意识。不幸的是,对于其他科学家所渴求的数据,公众并不一定都能像对空气污染数据那样感兴趣。实现公共数据的全面透明公开还是有很长的路要走。


这样的限制不仅仅存在于中国国内的数据。国外学术资源有时也难以获取。一些信息管理部门为了过滤疑似有害信息,人为设置了数字屏障。


我作为一名中国科学家的生活已经受到了影响。可靠的学术文献搜索几乎不可能。没有了谷歌学术搜索引擎(相对于别的学术搜索引擎我更喜欢谷歌,因为可以同时搜索书籍、论文、专利和技术报告),我只好一个个地去搜索出版商运营的数据库,至少目前它们还是可以访问的。


网络安全对国家安全是很重要的,但好的数据是科学进步和经济发展的支柱。资源共享信息的开放可以巩固经济和社会幸福。在中国,解决这些矛盾需要全面性的研究,以便我们建立起一套能够利于多方的高效合理的数据管理机制。更迫切的是,研究者们应当被给予更大的权限,特别是对于公共数据和学术搜索引擎。



原文发布时间为:2015-05-01


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
19天前
|
人工智能 自然语言处理 Shell
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
本教程指导用户在开源AI助手Clawdbot中集成阿里云百炼API,涵盖安装Clawdbot、获取百炼API Key、配置环境变量与模型参数、验证调用等完整流程,支持Qwen3-max thinking (Qwen3-Max-2026-01-23)/Qwen - Plus等主流模型,助力本地化智能自动化。
32159 117
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
|
9天前
|
应用服务中间件 API 网络安全
3分钟汉化OpenClaw,使用Docker快速部署启动OpenClaw(Clawdbot)教程
2026年全新推出的OpenClaw汉化版,是基于Claude API开发的智能对话系统本土化优化版本,解决了原版英文界面的使用壁垒,实现了界面、文档、指令的全中文适配。该版本采用Docker容器化部署方案,开箱即用,支持Linux、macOS、Windows全平台运行,适配个人、企业、生产等多种使用场景,同时具备灵活的配置选项和强大的扩展能力。本文将从项目简介、部署前准备、快速部署、详细配置、问题排查、监控维护等方面,提供完整的部署与使用指南,文中包含实操代码命令,确保不同技术水平的用户都能快速落地使用。
4713 4
|
15天前
|
人工智能 安全 机器人
OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手
OpenClaw(原Clawdbot)是一款开源本地AI助手,支持钉钉、飞书等多平台接入。本教程手把手指导Linux下部署与钉钉机器人对接,涵盖环境配置、模型选择(如Qwen)、权限设置及调试,助你快速打造私有、安全、高权限的专属AI助理。(239字)
6802 18
OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手
|
14天前
|
人工智能 机器人 Linux
OpenClaw(Clawdbot、Moltbot)汉化版部署教程指南(零门槛)
OpenClaw作为2026年GitHub上增长最快的开源项目之一,一周内Stars从7800飙升至12万+,其核心优势在于打破传统聊天机器人的局限,能真正执行读写文件、运行脚本、浏览器自动化等实操任务。但原版全英文界面对中文用户存在上手门槛,汉化版通过覆盖命令行(CLI)与网页控制台(Dashboard)核心模块,解决了语言障碍,同时保持与官方版本的实时同步,确保新功能最快1小时内可用。本文将详细拆解汉化版OpenClaw的搭建流程,涵盖本地安装、Docker部署、服务器远程访问等场景,同时提供环境适配、问题排查与国内应用集成方案,助力中文用户高效搭建专属AI助手。
4766 11
|
16天前
|
人工智能 机器人 Linux
保姆级 OpenClaw (原 Clawdbot)飞书对接教程 手把手教你搭建 AI 助手
OpenClaw(原Clawdbot)是一款开源本地AI智能体,支持飞书等多平台对接。本教程手把手教你Linux下部署,实现数据私有、系统控制、网页浏览与代码编写,全程保姆级操作,240字内搞定专属AI助手搭建!
5665 21
保姆级 OpenClaw (原 Clawdbot)飞书对接教程 手把手教你搭建 AI 助手
|
12天前
|
人工智能 JavaScript 安全
Claude Code 安装指南
Claude Code 是 Anthropic 推出的本地 AI 编程助手,支持 Mac/Linux/WSL/Windows 多平台一键安装(Shell/PowerShell/Homebrew/NPM),提供 CLI 交互、代码生成、审查、Git 提交等能力,并内置丰富斜杠命令与自动更新机制。
4230 0
|
16天前
|
存储 人工智能 机器人
OpenClaw是什么?阿里云OpenClaw(原Clawdbot/Moltbot)一键部署官方教程参考
OpenClaw是什么?OpenClaw(原Clawdbot/Moltbot)是一款实用的个人AI助理,能够24小时响应指令并执行任务,如处理文件、查询信息、自动化协同等。阿里云推出的OpenClaw一键部署方案,简化了复杂配置流程,用户无需专业技术储备,即可快速在轻量应用服务器上启用该服务,打造专属AI助理。本文将详细拆解部署全流程、进阶功能配置及常见问题解决方案,确保不改变原意且无营销表述。
6229 6
|
18天前
|
人工智能 JavaScript 应用服务中间件
零门槛部署本地AI助手:Windows系统Moltbot(Clawdbot)保姆级教程
Moltbot(原Clawdbot)是一款功能全面的智能体AI助手,不仅能通过聊天互动响应需求,还具备“动手”和“跑腿”能力——“手”可读写本地文件、执行代码、操控命令行,“脚”能联网搜索、访问网页并分析内容,“大脑”则可接入Qwen、OpenAI等云端API,或利用本地GPU运行模型。本教程专为Windows系统用户打造,从环境搭建到问题排查,详细拆解全流程,即使无技术基础也能顺利部署本地AI助理。
7759 17