Cloudera全新数据科学工作台加快企业数据科学及机器学习-阿里云开发者社区

Cloudera全新数据科学工作台加快企业数据科学及机器学习

2017-08-30 1240

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

近日，机器学习和先进分析平台提供商Cloudera发布了测试版Cloudera数据科学工作台（Data Science Workbench），它是一款基于Cloudera企业版运行数据科学的自助工具。Cloudera数据科学工作台以去年所收购的数据科学初创企业Sense.io的技术为基础，使数据科学家可以使用其偏好的开源语言（包括R、Python和Scala），集成原生Apache Spark和Apache Hadoop的安全企业平台上的资源库，从而加快分析项目从探索到生产的进展速度。

Cloudera产品高级副总裁Charles Zedlewski表示：“Cloudera的工作重点在于改善数据科学和工程团队的用户体验，尤其是那些希望借助Spark进行数据处理和机器学习、并以此提高分析能力的用户。Sense.io及其团队的加入为我们带来了坚实的基础，使我们的数据科学工作台可以为客户提供大规模的自助式数据科学支持。”

对于数据科学家：

支持将R、Python或Scala搭配个人优选的资源库和框架，通过网页浏览器直接使用
可通过Spark和Impala直接访问安全的Hadoop集群上的数据
与整个团队分享洞察，实现可复制、协作式的研究

对于IT专业人士：

令数据科学团队可自由选择工作方式和时间
与外部支持保持合规，实现Hadoop、尤其是Kerberos的充分安全性
可在本地或云端运行，无论身在何处，均可轻松管理数据

随着开放数据科学跨越了广泛的Python和R生态系统，拓展到了Tensorflow、Microsoft Cognitive Toolkit、MXnet和BigDL等深度学习框架中，加之越来越多的数据被储存在Hadoop环境里，数据科学团队正在努力寻求利用这些工具的方法。Cloudera数据科学工作台提供了一个安全可靠的环境，可将最新的开源创新技术与Cloudera客户所信赖的统一平台相结合。

Zedlewski还表示：“鉴于数据科学家们的需求非常多样化，让他们进入共享环境往往给用户的IT团队带来巨大的挑战，特别是涉及开源工具的情况下，常造成重复工作、分析孤岛，以及降低安全性和管理能力等挑战。与此同时，数据科学家正在为其事业不断追求更大的数据集和更强大的计算平台。凭借我们的数据科学工作台，Cloudera可以帮助IT团队和数据科学家开展协作，让更多用户以灵活和合规的方式加入共享环境。”

原文发布时间为：2017年3月16日

本文来自云栖社区合作伙伴至顶网，了解相关信息可以关注至顶网。

Cloudera全新数据科学工作台加快企业数据科学及机器学习

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Cloudera全新数据科学工作台加快企业数据科学及机器学习

热门文章

最新文章

相关课程

相关电子书

相关实验场景