暂无个人介绍
能力说明:
了解变量作用域、Java类的结构,能够创建带main方法可执行的java应用,从命令行运行java程序;能够使用Java基本数据类型、运算符和控制结构、数组、循环结构书写和运行简单的Java程序。
暂时未有相关云产品技术能力~
阿里云技能认证
详细说明写在2020年,展望未来10年,“全民”的基因组时代正在加速到来,它必然将全方位的加深我们对于生命科学的理解,为人类疾病的预防、诊断和治疗提供全新的技术手段,诞生一个庞大的生命经济产业。根据统计,全球用于罕见病,癌症的全基因组测序的样本数,在未来几年内可能很快就超过10亿级别的规模。这对于任何从事这一领域的科学家、研究机构、政府和企业来说,面临行业的浪潮,是巨大的机遇,也必然是巨大的挑战。
GATK 软件分析流程由阿里云和 Broad Institute 合作提供。Broad Institute 提供的 GATK 流程最佳实践用 工作流定义语言(WDL) 编写,通过批量计算集成的 Cromwell 工作流引擎解析执行。用户将为作业运行时实际消耗的计算和存储资源付费,不需要支付资源之外的附加费用。 Broad Institute GATK 网站和论坛为 GATK 工具和 WDL 提供了更完整的背景信息,文档和支持。 如果需要执行用 WDL 编写的通用工作流程,请参考 cromwell 工作流引擎和 WDL 支持的 APP 。
从1900年孟德尔遗传定律被重新发现,到摩尔根的连锁和交换定律,再到1953年沃森(James D. Watson)和克里克(Francis Crick)发现DNA双螺旋结构,在不远的近现代科学史中,人们逐渐揭开自然界丰富多彩生物多样性背后的遗传与演化规律,建立了一套完整的学科体系。所有物种都有共同的起源,个体随机产生变异信息,通过定向的自然选择作用,再稳定遗传给下一代,以适应不断变化的外界环境,并由此进化出地球上所有的生命,包括人类。基因,作为整个遗传过程的基本单元,本质上就是一段具有功能性的DNA或者RNA的序列,它存储着生命体的所有信息,与我们每个人的生老病死都息息相关。
-
我好像是一个在海边玩耍的孩子,不时为拾到比通常更光滑的石子或更美丽的贝壳而欢欣鼓舞,而展现在我面前的是完全未探明的真理之海。 ——牛顿临终遗言
-
-
-
-
-
-
原文链接:https://databricks.com/blog/2019/06/26/scaling-genomic-workflows-with-spark-sql-bgen-and-vcf-readers.html
阿里云E-HPC(弹性高性能计算)在最近的发布中支持多队列调度以及管理,另外发布针对多队列调度自动伸缩的策略支持。
本文主要介绍如何在ACK上基于工作流引擎进行大规模基因测序工作。阿里云工作流引擎基于开源项目Argo实现,支持并发、循环、重试等多种执行策略。