暂无个人介绍
2017云栖大会深圳峰会,阿里云高级产品专家陈鹏宇带来题为“数加:迈向数据智能之路”的演讲。本文引入一个数据工程师到首席数据官的七次升职过程,阐述了阿里大数据的进化史,其中包括Quick BI、DataV、PAI、公众趋势分析、MaxCompute & Data IDE以及推荐引擎等都进行了详细的解析,一起来了解下吧。
在云栖社区和云翼计划联合主办的首届互联网新兵进阶在线峰会上,来自阿里云UED部门的交互设计师小民带来了《设计新人到设计新人》的分享。在分享中,他详细阐述了新是一种持续热爱而非功利;新是一种渐变生长而非突变;新是勇敢坚持而非时髦;新是一种归零和旁观。
5月25日,云栖社区与云翼计划联合主办了首届互联网新兵进阶在线峰会,Alibaba 中台业务事业群中间件技术部沈询带来题为“咱们都是技术人”的演讲。本文主要从沈询的自身故事谈起,包括初入职场、前期发展和成长突破,接着从心、脑、体三方面分享了感想,最后作了简要总结。一起来了解下吧
在首届互联网新兵进阶在线峰会上,来自阿里巴巴天猫事业部的产品经理叶夕分享了《看,那人好像一个产品狗》。他主要从自己两年来产品新人经历出发,分享了一路走来的心路历程。他首先介绍了产品经理这个职位以及需要做的工作,然后分享了产品经理求职过程中的准备以及自己在阿里做产品经理的感受。
5月25日,云栖社区与云翼计划联合主办了首届互联网新兵进阶在线峰会,优酷资深交互设计师带来西戎题为“不当“乖宝”的新人设计师是怎样成为独角兽的”的演讲。本文主要从求学经历开始谈起,接着重点讲述了西戎的面试经验,然后着重分享了入职后的心路历程,最后对未来作了简要规划。一起来了解下
十余载寒窗,一朝迈入社会,翘首以盼中结束的学生生涯往往也是纠结的开始:目光转向同学斩获的各种offer,两手空空的不甘与无奈谁人能懂;带着欢快的心情走向工作岗位,竞争的激烈却让自己处处碰壁。在云栖社区与云翼计划联合主办的《首届互联网新兵进阶在线峰会》上,阿里云前端开发工程师行剑介绍了自己在校园技术类社团成长和活动的经历,并给校招中的同学提供了三个必备锦囊。
本次分享内容主要包括三部分:(一)分布式存储系统应该具备的能力;(二)阿里云分布式存储系统盘古的介绍;(三)分布式系统技术展望。
本文主要内容是分布式编程模型设计与演化,具体分为分布式编程模型的背景、MapReduce编程模型、关系型数据编程模型、分布式图计算模型分布式编程未来展望五部分。
在2017云栖大会大数据专场,阿里云高级专家云郎分享了《大数据计算服务MaxCompute产品最新动态》。他首先介绍了MaxCompute的发展历程和技术架构,然后对MaxCompute 2.0版本新特性和新技术进行了详细介绍。
本文主要从关系型计算基本原理(逻辑查询计划和SQL、物理查询计划)、分布式环境中的连接计算、分布式环境中的聚合计算、其他计算和物理优化四个方面深度解析了分布式离线关系型计算的基本原理和算法。
本文从背景、分布式文件系统、容错机制、分布式节点距离计算法则、数据分布策略、分布式计算调度、跨IDC集群规划的两种方式、ODPS跨集群数据依赖等方面深度介绍了分布式大数据系统中全局数据调度和管理。
来自阿里云IDST褚崴为大家带来分布式机器学习平台方面的内容,主要从大数据的特点和潜在价值开始讲起,然后介绍阿里的业务场景中常用到的机器学习算法,以及阿里采用的分布式机器学习框架,最后介绍了PAI算法平台,一起来看下吧。
在菜鸟—需求预测与分仓规划比赛上,“我们为R代言”团队获得了季军。在分享中,“我们为R代言”团队主要对赛题进行了分析,提出了选择机器学习的理由,介绍了团队线下解决方案实现过程。
在菜鸟—需求预测与分仓规划比赛上,“天亮”团队获得了亚军。“天亮”团队主要分享了团队的特征分析以及方案实现过程。
在菜鸟—需求预测与分仓规划比赛上,“商品小A”团队获得了冠军。队长袁光浩分享了“商品小A”团队的数据探索以及算法实现过程。
在大数据创新大赛上,来自浙江大学的SeaSide团队带来了关于机场客流量的时空分布预测的解决方案。SeaSide团队主要从时序模型、乘机流程、事件驱动、维度灾难四个方面介绍了团队的算法设计。
2016中国高校计算机大赛大数据挑战赛上,data_coders团队对阿里音乐流行趋势预测进行了自己的阐述理解。首先对赛题进行了分析,确定解题思路,重点对算法进行了说明,包括类别分析、特征提取和算法模型,最后做了简要的总结。一起来欣赏下。
2016中国高校计算机大赛大数据挑战赛上,Heal the World团队对阿里音乐流行趋势预测展示了自己的比赛成果。主要从问题分析开始谈起,确定解题思路,重点分享了分类与预测,进行了五步分离,最后做了简要总结。擦亮眼睛快看看吧。
广东航空大数据创新大赛中,大熊座epsilon的同学们分享了比赛成果。首先从数据预处理、数据反映规律开始讲起,确定了工作流程,重点解释了方案设计,包括二段式模型和时序回归方法,最后对算法优势和应用作了总结。一起来了解下吧。
2016中国高校计算机大赛大数据挑战赛上,陕西师范大学网路信息中心团队对阿里音乐流行趋势预测进行了自己的成果展示。首先从解题思路开始谈起,重点对算法进行了阐述,包括类别最优值选择法和子序列模式匹配法,最后对比赛中遇到的问题进行了总结。一起来了解下。
2016中国高校计算机大赛——大数据挑战赛是由教育部和全国高等学校计算机教育研究会联合主办,清华大学和阿里云联合承办,在“天池大数据众智平台”上开展的高端算法竞赛。本次赛题是对于阿里音乐流行趋势进行预测,本文整理自大赛冠军团队Datahacker团队的答辩演讲。
2016“数据引领 飞粤云端”广东航空大数据创新大赛,由广东省人民政府和阿里巴巴集团联合主办,旨在提高全社会对大数据价值的认识,培养大数据应用人才,鼓励数据创新创业实践,推动航空大数据技术成果转化和落地。本文整理自本次大赛极客奖获奖团队Oh my god的现场答辩。
尽管数据科学家经常通过分布式云计算来处理数据,但是即使在一般的笔记本电脑上,只要给出足够的内存,Spark也可以工作正常(在这篇文章中,我使用2016年MacBook Pro / 16GB内存,分配给Spark 8GB内存)。
辞旧迎新之际,更是钻研技术的最佳时机......秉持这一原则,咱们依然诚意十足,特线上墨迹天气与东润环能玩转数据的姿势;此外,小编还特别给大家准备了数据导入的技巧。
毫无疑问,硅谷和华盛顿一直以来都是人们寻找大数据工作的两大地点。原因显而易见,众多高科技创业公司带动着加州对大数据人才的需求,美国政府也是全球最大的科技型雇主。
第一次听闻Spark是2013年年末,当时笔者对Scala(Spark的编程语言)感兴趣。一段时间之后做了一个有趣的数据科学项目,试图预测泰坦尼克号上的生还情况(Kaggle竞赛项目,通过使用机器学习预测泰坦尼克号上哪些乘客具备更高的生还可能性)。通过该项目可以更深入地理解Spark的概念和编程方式
随着数据量的不断增加,不使用可视化来描述事例是不可能的。 数据可视化是一种将数字转化为有用知识的艺术。
14位专家告诉你,数据科学和预测分析领域在2016年取得的主要发展,以及2017年可能发生的变化趋势。
在这篇简短的指导中,笔者将会简短地回顾一种方法并且用我喜欢的数据集来演示。这不是一个ML库也不是一个Kaggle竞赛的数据集,仅仅是积累了数十年笔者跟踪塑料模型集合产生的数据,如此这般一定会适合传统的标准。
迄今为止世界范围内已经有超过200位数据科学家参与了调查,然而结果显示并没有一种在数据科学领域占绝对优势的编程语言,但是也似乎主要集中在有限几个选项里:几乎96%的参与者断言至少要用R,SQL或者Phython中的一种。
阿里巴巴大数据计算平台需要每天不间断的跑在上万台机器集群上,上面承担阿里核心分析计算任务,有着很高的可靠性和SLA的要求,但是我们同时需要持续不断提高系统的性能,降低成本,提供更多功能来满足日益增长的业务需求,这样就要求持续不断的升级正在服务的系统。
阿里巴巴算法专家郑重分享了《阿里云推荐引擎》。他首先介绍了从搜索到导航到推荐的历程,然后分享了搜索引擎和推荐系统架构,推荐系统中需求、系统、动机的具体解决方案,最后介绍了阿里云推荐引擎、用户基因分析、行业解决方案。