大数据助力材料科学

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 新材料哺育新发明。Gorilla Glass已经大量被应用于智能手机;凯夫拉在拯救生命之余开始进入消费级产品;锂离子电池技术为高能耗设施提供了动力来源。但是,研发新材料却是一项极其费时费力的任务。

新材料哺育新发明。Gorilla Glass已经大量被应用于智能手机;凯夫拉在拯救生命之余开始进入消费级产品;锂离子电池技术为高能耗设施提供了动力来源。但是,研发新材料却是一项极其费时费力的任务。

创造一种全新的突破性材料是极其费时的过程 – 尤其是和那些依赖这些材料的产品的研发周期相比。波音787梦幻客机从概念到商业航行只花了9年不到;苹果从2005年开始设计iPhone,2007年就可以正式上市。作为对比,新型材料的诞生可能要花上长达20年的研究和实验。

两年前,美国政府以突破这个科技瓶颈为目标,成立了Materials Genome Initiative(MGI)项目。MGI的目标是大幅减少新材料研发所需的时间和财力投入。和人类基因组计划为我们的基因绘制地图的任务类似,科学家想要通过MGI找出元素间的互相作用对材料的种类和性质带来的广泛影响。以这些知识作为基础,科学家和工程师们将有希望以更短的周期为不同应用“定制”相应的材料。

元素间排列组合的数目多如牛毛,其中大多数对我们来说没有意义。而试图在实验室里穷尽这些排列组合是完全不合实际的。所以,MGI的一些项目组已经开始借助大数据的力量来模拟所有的可能性,然后通过分析数据向有潜力的方向进行深入研究。

成立多年以来,MGI促成了一些第三方项目的合作。其中就有来自麻省理工学院的Materials Project和哈佛的Clean Energy Project。这两个计划以相似的理论基础寻求不同的答案。前者的研究集中在无机固体上,尤其以电池材料为主,而后者的清洁能源计划以可用于太阳能电池的分子材料为中心。两者均利用密度泛函理论(Density Functional Theory)收集的巨型数据库来预测模拟物质模型的实际属性。

MIT的Material Project大约在8年前在Gerbrand Ceder教授的帮助下成立。作为多家公司的顾问,Ceder积累了大量成果。但是和少数公司的合作使得这些宝贵数据被封闭起来。“如果我们向所有人提供这些数据,人们会创造出很多惊人的成果,这就是Materials Project,”他说。目前, MIT的数据库里保存了大约10万种已知或理论上的材料信息。为了充分发挥这些数据在新材料研发中的作用,MIT学者用人工筛选加机器学习的方式来探索各种化学定律。

类似的,哈佛清洁能源计划也用人工加机器组合来探索其数据库。该计划始于一次对有机太阳能电池材料概念的验证实验。学者们完全虚拟的情况下计算了大约15种新型混合物在现实世界里的表现。模拟运算的最终结果是一种有超强电气性质的新物质。这还只是一名研究生通过几次实验得出的结果,想象如果从一支志愿者大军那儿借来他们的运算能力,结果会放大多少?

这正是清洁能源计划如今采用的策略:任何人都可以通过在电脑上下载一个程度来进行运算并把返还结果。有了这个可任意支配的巨大资源,学者们已经计算了几百万种潜在组合 – 这仅仅是个开端。“项目进入了一个十分有趣的阶段”Hachmann博士说,“对我们来说差不多是从辛勤劳动中采集硕果的时候了。”目前,哈佛在网上发布了230万种混合物组合供所有人研究使用。虽然这些数据的初衷是助力太阳能电池的研发,科学家也可用任何有价值的信息来帮助其它方面的研究。MIT也有个网络入口供人们读取Materials Project的数据。

Ceder希望伟大的MGI计划能够完成它的使命。事实上,Ceder已经看到一些成果了,他正在为一项新的电池材料申请专利,这对于成长中的MGI和电池技术开发来说都是很好的成绩。Ceder认为互联网和大数据的加入能为这个计划带来无法预知的进步和发现,“当拥有这种组合的时候,你无法预测人们将会带给你什么。”


原文发布时间为:2013-09-30


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
3月前
|
人工智能 分布式计算 大数据
超级计算与大数据:推动科学研究的发展
【9月更文挑战第30天】在信息时代,超级计算和大数据技术正成为推动科学研究的关键力量。超级计算凭借强大的计算能力,在尖端科研、国防军工等领域发挥重要作用;大数据技术则提供高效的数据处理工具,促进跨学科合作与创新。两者融合不仅提升了数据处理效率,还推动了人工智能、生物科学等领域的快速发展。未来,随着技术进步和跨学科合作的加深,超级计算与大数据将在科学研究中扮演更加重要的角色。
|
存储 数据采集 机器学习/深度学习
什么是科学问题,大数据考试题
什么是科学问题,大数据考试题
103 2
什么是科学问题,大数据考试题
|
数据采集 SQL 存储
数据引力,数据倾斜,数据距离,大数据科学
本文主要内容是介绍教育大数据的定义与作用,在了解教育大数据前我们首先要了解什么是大数据。大数据技术是21世纪最具时代标志的技术之一。国务院发布的《促进大数据发展行动纲要》中提出“大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合”。简单的说,大数据就是将海量碎片化的信息数据能够及时地进行筛选、分析,并最终归纳、整理出我们需要的资讯。
214 2
数据引力,数据倾斜,数据距离,大数据科学
|
数据可视化 大数据 索引
|
人工智能 物联网 大数据
云栖科技评论第60期:云、大数据与AI:大科学时代的“三剑客”
简单一句话:数据是介质,云是协作平台,AI是知识发现的助力。有趣的是,随着支持大科学时代的大尺度问题的解决,不断面对大规模数据计算与存储、大范围协作平台以及深层次知识发现等问题的云与AI,也将得到“反哺”,得以实现“高维”学习,持续提高其功能与能力。
3604 0
|
大数据 量子技术 vr&ar
|
分布式计算 大数据 Hadoop
《Spark与Hadoop大数据分析》——1.2 大数据科学以及Hadoop和Spark在其中承担的角色
本节书摘来自华章计算机《Spark与Hadoop大数据分析》一书中的第1章,第1.2节,作者 [美]文卡特·安卡姆(Venkat Ankam),译 吴今朝,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1546 0