大数据史记_个人页

大数据史记

文章

问答

视频

个人介绍

暂无个人介绍

擅长的技术

获得更多能力

通用技术能力：

暂时未有相关通用技术能力~

云产品技术能力：

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明

高分内容

最新动态

文章
问答
视频

发表了文章 2017-06-14

设计新人到设计新人=菜鸟到菜鸟？NO！

在云栖社区和云翼计划联合主办的首届互联网新兵进阶在线峰会上，来自阿里云UED部门的交互设计师小民带来了《设计新人到设计新人》的分享。在分享中，他详细阐述了新是一种持续热爱而非功利；新是一种渐变生长而非突变；新是勇敢坚持而非时髦；新是一种归零和旁观。
发表了文章 2017-06-13

咱们都是技术人

5月25日，云栖社区与云翼计划联合主办了首届互联网新兵进阶在线峰会，Alibaba 中台业务事业群中间件技术部沈询带来题为“咱们都是技术人”的演讲。本文主要从沈询的自身故事谈起，包括初入职场、前期发展和成长突破，接着从心、脑、体三方面分享了感想，最后作了简要总结。一起来了解下吧
发表了文章 2017-06-13

看，那人好像一个产品狗，对，这就是产品狗

在首届互联网新兵进阶在线峰会上，来自阿里巴巴天猫事业部的产品经理叶夕分享了《看，那人好像一个产品狗》。他主要从自己两年来产品新人经历出发，分享了一路走来的心路历程。他首先介绍了产品经理这个职位以及需要做的工作，然后分享了产品经理求职过程中的准备以及自己在阿里做产品经理的感受。
发表了文章 2017-06-07

不想当“乖宝”的新人设计师是怎么成为独角兽的

5月25日，云栖社区与云翼计划联合主办了首届互联网新兵进阶在线峰会，优酷资深交互设计师带来西戎题为“不当“乖宝”的新人设计师是怎样成为独角兽的”的演讲。本文主要从求学经历开始谈起，接着重点讲述了西戎的面试经验，然后着重分享了入职后的心路历程，最后对未来作了简要规划。一起来了解下
发表了文章 2017-06-06

全栈新兵成长记，附赠校招三大锦囊

十余载寒窗，一朝迈入社会，翘首以盼中结束的学生生涯往往也是纠结的开始：目光转向同学斩获的各种offer，两手空空的不甘与无奈谁人能懂；带着欢快的心情走向工作岗位，竞争的激烈却让自己处处碰壁。在云栖社区与云翼计划联合主办的《首届互联网新兵进阶在线峰会》上，阿里云前端开发工程师行剑介绍了自己在校园技术类社团成长和活动的经历，并给校招中的同学提供了三个必备锦囊。
发表了文章 2017-05-21

分布式存储系统

本次分享内容主要包括三部分：（一）分布式存储系统应该具备的能力；（二）阿里云分布式存储系统盘古的介绍；（三）分布式系统技术展望。
发表了文章 2017-05-21

分布式编程模型的设计与演化

本文主要内容是分布式编程模型设计与演化，具体分为分布式编程模型的背景、MapReduce编程模型、关系型数据编程模型、分布式图计算模型分布式编程未来展望五部分。
发表了文章 2017-05-18

想知道的都在这里，分布式离线关系型计算最全总结

本文主要从关系型计算基本原理（逻辑查询计划和SQL、物理查询计划）、分布式环境中的连接计算、分布式环境中的聚合计算、其他计算和物理优化四个方面深度解析了分布式离线关系型计算的基本原理和算法。
发表了文章 2017-05-18

分布式大数据系统巧实现，全局数据调度管理不再难

本文从背景、分布式文件系统、容错机制、分布式节点距离计算法则、数据分布策略、分布式计算调度、跨IDC集群规划的两种方式、ODPS跨集群数据依赖等方面深度介绍了分布式大数据系统中全局数据调度和管理。
发表了文章 2017-05-17

大规模数据的分布式机器学习平台

来自阿里云IDST褚崴为大家带来分布式机器学习平台方面的内容，主要从大数据的特点和潜在价值开始讲起，然后介绍阿里的业务场景中常用到的机器学习算法，以及阿里采用的分布式机器学习框架，最后介绍了PAI算法平台，一起来看下吧。
发表了文章 2017-04-05

菜鸟—需求预测与分仓规划季军——“我们为R代言”团队赛后总结

在菜鸟—需求预测与分仓规划比赛上，“我们为R代言”团队获得了季军。在分享中，“我们为R代言”团队主要对赛题进行了分析，提出了选择机器学习的理由，介绍了团队线下解决方案实现过程。
发表了文章 2017-04-05

菜鸟—需求预测与分仓规划亚军——“天亮”团队赛后总结

在菜鸟—需求预测与分仓规划比赛上，“天亮”团队获得了亚军。“天亮”团队主要分享了团队的特征分析以及方案实现过程。
发表了文章 2017-04-05

菜鸟—需求预测与分仓规划冠军——“商品小A”团队赛后总结

在菜鸟—需求预测与分仓规划比赛上，“商品小A”团队获得了冠军。队长袁光浩分享了“商品小A”团队的数据探索以及算法实现过程。
发表了文章 2017-04-05

2016大数据创新大赛——机场客流量的时空分布预测模型解析

在大数据创新大赛上，来自浙江大学的SeaSide团队带来了关于机场客流量的时空分布预测的解决方案。SeaSide团队主要从时序模型、乘机流程、事件驱动、维度灾难四个方面介绍了团队的算法设计。
发表了文章 2017-04-05

2016中国高校计算机大赛——大数据挑战赛极客奖：data_coders团队

2016中国高校计算机大赛大数据挑战赛上，data_coders团队对阿里音乐流行趋势预测进行了自己的阐述理解。首先对赛题进行了分析，确定解题思路，重点对算法进行了说明，包括类别分析、特征提取和算法模型，最后做了简要的总结。一起来欣赏下。
发表了文章 2017-04-05

2016中国高校计算机大赛——大数据挑战赛季军：Heal the World团队

2016中国高校计算机大赛大数据挑战赛上，Heal the World团队对阿里音乐流行趋势预测展示了自己的比赛成果。主要从问题分析开始谈起，确定解题思路，重点分享了分类与预测，进行了五步分离，最后做了简要总结。擦亮眼睛快看看吧。
发表了文章 2017-04-05

2016“数据引领飞粤云端”广东航空大数据创新大赛亚军：大熊座epsilon

广东航空大数据创新大赛中，大熊座epsilon的同学们分享了比赛成果。首先从数据预处理、数据反映规律开始讲起，确定了工作流程，重点解释了方案设计，包括二段式模型和时序回归方法，最后对算法优势和应用作了总结。一起来了解下吧。
发表了文章 2017-04-05

2016中国高校计算机大赛——大数据挑战赛亚军：陕西师范大学团队

2016中国高校计算机大赛大数据挑战赛上，陕西师范大学网路信息中心团队对阿里音乐流行趋势预测进行了自己的成果展示。首先从解题思路开始谈起，重点对算法进行了阐述，包括类别最优值选择法和子序列模式匹配法，最后对比赛中遇到的问题进行了总结。一起来了解下。
发表了文章 2017-04-05

2016中国高校计算机大赛——大数据挑战赛冠军：Datahacker团队

2016中国高校计算机大赛——大数据挑战赛是由教育部和全国高等学校计算机教育研究会联合主办，清华大学和阿里云联合承办，在“天池大数据众智平台”上开展的高端算法竞赛。本次赛题是对于阿里音乐流行趋势进行预测，本文整理自大赛冠军团队Datahacker团队的答辩演讲。
发表了文章 2017-04-05

2016“数据引领飞粤云端”广东航空大数据创新大赛极客奖：Oh my god团队

2016“数据引领飞粤云端”广东航空大数据创新大赛，由广东省人民政府和阿里巴巴集团联合主办，旨在提高全社会对大数据价值的认识，培养大数据应用人才，鼓励数据创新创业实践，推动航空大数据技术成果转化和落地。本文整理自本次大赛极客奖获奖团队Oh my god的现场答辩。
发表了文章 2017-01-27

用Spark分析Amazon的8000万商品评价（内含数据集、代码、论文）

尽管数据科学家经常通过分布式云计算来处理数据，但是即使在一般的笔记本电脑上，只要给出足够的内存，Spark也可以工作正常（在这篇文章中，我使用2016年MacBook Pro / 16GB内存，分配给Spark 8GB内存）。
发表了文章 2017-01-16

技术&案例：墨迹天气与东润环能的大数据把玩姿势

辞旧迎新之际，更是钻研技术的最佳时机......秉持这一原则，咱们依然诚意十足，特线上墨迹天气与东润环能玩转数据的姿势；此外，小编还特别给大家准备了数据导入的技巧。
发表了文章 2017-01-12

北美大数据玩家乐园Top10

毫无疑问，硅谷和华盛顿一直以来都是人们寻找大数据工作的两大地点。原因显而易见，众多高科技创业公司带动着加州对大数据人才的需求，美国政府也是全球最大的科技型雇主。
发表了文章 2017-01-12

Spark入门必学：预测泰坦尼克号上的生还情况

第一次听闻Spark是2013年年末，当时笔者对Scala(Spark的编程语言)感兴趣。一段时间之后做了一个有趣的数据科学项目，试图预测泰坦尼克号上的生还情况（Kaggle竞赛项目，通过使用机器学习预测泰坦尼克号上哪些乘客具备更高的生还可能性）。通过该项目可以更深入地理解Spark的概念和编程方式
发表了文章 2017-01-09

R语言中值得学习的7个可视化，附代码段&案例数据集

随着数据量的不断增加，不使用可视化来描述事例是不可能的。数据可视化是一种将数字转化为有用知识的艺术。
发表了文章 2016-12-30

2016美国大选预测失败意味着什么？14位专家帮你分析数据科学的未来

14位专家告诉你，数据科学和预测分析领域在2016年取得的主要发展，以及2017年可能发生的变化趋势。
发表了文章 2016-12-30

将一个电子表格迁移到MySQL和Spark2.0.1上

在这篇简短的指导中，笔者将会简短地回顾一种方法并且用我喜欢的数据集来演示。这不是一个ML库也不是一个Kaggle竞赛的数据集，仅仅是积累了数十年笔者跟踪塑料模型集合产生的数据，如此这般一定会适合传统的标准。
发表了文章 2016-12-30

R、SQL、Python，看数据科学家最喜欢的编程语言

迄今为止世界范围内已经有超过200位数据科学家参与了调查，然而结果显示并没有一种在数据科学领域占绝对优势的编程语言，但是也似乎主要集中在有限几个选项里：几乎96%的参与者断言至少要用R，SQL或者Phython中的一种。
发表了文章 2016-12-29

高可用的大数据计算平台如何持续发布和演进

阿里巴巴大数据计算平台需要每天不间断的跑在上万台机器集群上，上面承担阿里核心分析计算任务，有着很高的可靠性和SLA的要求，但是我们同时需要持续不断提高系统的性能，降低成本，提供更多功能来满足日益增长的业务需求，这样就要求持续不断的升级正在服务的系统。
发表了文章 2016-12-29

需求、系统、动机如何满足？阿里云推荐系统架构深度解析

阿里巴巴算法专家郑重分享了《阿里云推荐引擎》。他首先介绍了从搜索到导航到推荐的历程，然后分享了搜索引擎和推荐系统架构，推荐系统中需求、系统、动机的具体解决方案，最后介绍了阿里云推荐引擎、用户基因分析、行业解决方案。

暂无更多信息

发表了文章 2017-06-14

设计新人到设计新人=菜鸟到菜鸟？NO！
发表了文章 2017-06-13

咱们都是技术人
发表了文章 2017-06-13

看，那人好像一个产品狗，对，这就是产品狗
发表了文章 2017-06-07

不想当“乖宝”的新人设计师是怎么成为独角兽的
发表了文章 2017-06-06

全栈新兵成长记，附赠校招三大锦囊
发表了文章 2017-05-21

分布式存储系统
发表了文章 2017-05-21

分布式编程模型的设计与演化
发表了文章 2017-05-18

想知道的都在这里，分布式离线关系型计算最全总结
发表了文章 2017-05-18

分布式大数据系统巧实现，全局数据调度管理不再难
发表了文章 2017-05-17

大规模数据的分布式机器学习平台
发表了文章 2017-04-05

菜鸟—需求预测与分仓规划季军——“我们为R代言”团队赛后总结
发表了文章 2017-04-05

菜鸟—需求预测与分仓规划亚军——“天亮”团队赛后总结
发表了文章 2017-04-05

菜鸟—需求预测与分仓规划冠军——“商品小A”团队赛后总结
发表了文章 2017-04-05

2016大数据创新大赛——机场客流量的时空分布预测模型解析
发表了文章 2017-04-05

2016中国高校计算机大赛——大数据挑战赛极客奖：data_coders团队
发表了文章 2017-04-05

2016中国高校计算机大赛——大数据挑战赛季军：Heal the World团队
发表了文章 2017-04-05

2016“数据引领飞粤云端”广东航空大数据创新大赛亚军：大熊座epsilon
发表了文章 2017-04-05

2016中国高校计算机大赛——大数据挑战赛亚军：陕西师范大学团队
发表了文章 2017-04-05

2016中国高校计算机大赛——大数据挑战赛冠军：Datahacker团队
发表了文章 2017-04-05

2016“数据引领飞粤云端”广东航空大数据创新大赛极客奖：Oh my god团队

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

正在加载, 请稍后...

暂无更多信息

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

大数据史记_个人页

个人介绍

擅长的技术

设计新人到设计新人=菜鸟到菜鸟？NO！

咱们都是技术人

看，那人好像一个产品狗，对，这就是产品狗

不想当“乖宝”的新人设计师是怎么成为独角兽的

全栈新兵成长记，附赠校招三大锦囊

分布式存储系统

分布式编程模型的设计与演化

想知道的都在这里，分布式离线关系型计算最全总结

分布式大数据系统巧实现，全局数据调度管理不再难

大规模数据的分布式机器学习平台

菜鸟—需求预测与分仓规划季军——“我们为R代言”团队赛后总结

菜鸟—需求预测与分仓规划亚军——“天亮”团队赛后总结

菜鸟—需求预测与分仓规划冠军——“商品小A”团队赛后总结

2016大数据创新大赛——机场客流量的时空分布预测模型解析

2016中国高校计算机大赛——大数据挑战赛极客奖：data_coders团队

2016中国高校计算机大赛——大数据挑战赛季军：Heal the World团队

2016“数据引领 飞粤云端”广东航空大数据创新大赛亚军：大熊座epsilon

2016中国高校计算机大赛——大数据挑战赛亚军：陕西师范大学团队

2016中国高校计算机大赛——大数据挑战赛冠军：Datahacker团队

2016“数据引领 飞粤云端”广东航空大数据创新大赛极客奖：Oh my god团队

用Spark分析Amazon的8000万商品评价（内含数据集、代码、论文）

技术&案例：墨迹天气与东润环能的大数据把玩姿势

北美大数据玩家乐园Top10

Spark入门必学：预测泰坦尼克号上的生还情况

R语言中值得学习的7个可视化，附代码段&案例数据集

2016美国大选预测失败意味着什么？14位专家帮你分析数据科学的未来

将一个电子表格迁移到MySQL和Spark2.0.1上

R、SQL、Python，看数据科学家最喜欢的编程语言

高可用的大数据计算平台如何持续发布和演进

需求、系统、动机如何满足？阿里云推荐系统架构深度解析

设计新人到设计新人=菜鸟到菜鸟？NO！

咱们都是技术人

看，那人好像一个产品狗，对，这就是产品狗

不想当“乖宝”的新人设计师是怎么成为独角兽的

全栈新兵成长记，附赠校招三大锦囊

分布式存储系统

分布式编程模型的设计与演化

想知道的都在这里，分布式离线关系型计算最全总结

分布式大数据系统巧实现，全局数据调度管理不再难

大规模数据的分布式机器学习平台

菜鸟—需求预测与分仓规划季军——“我们为R代言”团队赛后总结

菜鸟—需求预测与分仓规划亚军——“天亮”团队赛后总结

菜鸟—需求预测与分仓规划冠军——“商品小A”团队赛后总结

2016大数据创新大赛——机场客流量的时空分布预测模型解析

2016中国高校计算机大赛——大数据挑战赛极客奖：data_coders团队

2016中国高校计算机大赛——大数据挑战赛季军：Heal the World团队

2016“数据引领 飞粤云端”广东航空大数据创新大赛亚军：大熊座epsilon

2016中国高校计算机大赛——大数据挑战赛亚军：陕西师范大学团队

2016中国高校计算机大赛——大数据挑战赛冠军：Datahacker团队

2016“数据引领 飞粤云端”广东航空大数据创新大赛极客奖：Oh my god团队

2016“数据引领飞粤云端”广东航空大数据创新大赛亚军：大熊座epsilon

2016“数据引领飞粤云端”广东航空大数据创新大赛极客奖：Oh my god团队

2016“数据引领飞粤云端”广东航空大数据创新大赛亚军：大熊座epsilon

2016“数据引领飞粤云端”广东航空大数据创新大赛极客奖：Oh my god团队