【机器学习工具榜单】Tensorflow最多使用,Python 取代 R 成最受欢迎编程语言

简介: 近日,KDnuggets网站公布了2018年度的数据科学和机器学习工具调查结果。2300多名参与者对自己“过去 12 个月内在项目开发中使用过的数据挖掘 / 机器学习工具和编程语言”进行了投票。

近日,KDnuggets网站公布了2018年度的数据科学和机器学习工具调查结果。2300多名参与者对自己“过去 12 个月内在项目开发中使用过的数据挖掘 / 机器学习工具和编程语言”进行了投票。

最受欢迎的分析、数据科学、机器学习工具

60f7ce46650faa91f60164cd657a610038b1809a

图1:2018年最受欢迎的分析/数据科学/机器学习工具,以及与2016~2017年调查结果的对比

下表列举了最受欢迎的前11个工具,其中每个的占比都达到20%以上。

9c1697516488ba096adb2709e1106fbbc70083ea

表1:2018年最受欢迎的分析/数据科学/ 机器学习软件Top 10

上表中,2018 % share 是指使用这个工具的人占所有投票者的百分比,% change是指2018年相较2017年的投票变化。

每个受访者平均使用的工具数量为7.0个,略高于2017年的6.75个(排除了只选择1个工具的投票)。

与2017年的软件调查相比,今年新进入Top 10的是Keras。

Python取代R成为最受欢迎的编程语言

调查结果显示,Python在2017年调查中的占比已经超过50%,今年更是增加到66%,而R语言的占比自这个调查开始以来(今年是第19届)第一次下降到低于50%。

RapidMiner受欢迎程度大幅提高

在过去几次调查中,RapidMiner都是排名最高的数据科学平台,今年其占比从2017年的33%上升到50%。不过,这是由于RapidMiner采取了一些措施鼓励他们的用户参与该调查。

SQL排名保持稳定

SQL,包括Spark SQL和SQL to Hadoop工具,在过去的3次投票中每一次都有大约40%的投票占比。所以,如果你是数据科学家,学习SQL吧——它很可能在很长一段时间里都很有用。

趋势

下表列举了使用率增幅达到 20% 及以上,且2018 年使用率达到 3% 以上的工具。

4a5f312744af15be6036ff7612c17543db482083

表2:使用率增幅最大的主要分析/数据科学/机器学习工具

我们注意到,在2017年使用率达到2%或更高的56个工具中,有19个(约三分之一)在2018年使用率有所上升,而其余37个的使用率下降了。这和近期的几起收购(Datawatch收购Angoss, Minitab收购Salford)一起表明,数据科学平台的整合正在进行中。

下表列举了在2017年使用率至少有3%的工具,今年下降了25%甚至更多。

37aba6de5c17c5ad3159d37b3ab59f7027479f6e

表3:使用率跌幅最大的主要分析/数据科学工具。

深度学习工具

调查结果显示,近几年深度学习工具的使用比例保持稳定。今年的调查中有33%的投票者使用深度学习工具中,2017年和2016年的比率分别为32%和18%。

谷歌的TensorFlow仍然是是目前最受欢迎的深度学习平台,不过Keras的使用率也很高,接近TensorFlow。

PyTorch排在第3,使用率为6.4%。不过, KDnuggets 的读者更多是数据科学领域的,这个数据可能不能完全反映这些深度学习工具在研究社区中的真实受欢迎程度。PyTorch在今年有一次较大的升级更新,并且与Caffe 2合并,预计未来它的使用率将会更高。

深度学习工具排名

d47e62d2b349aca45e42305ed6714efbe5ed61d9 Tensorflow, 29.9%
d47e62d2b349aca45e42305ed6714efbe5ed61d9 Keras, 22.2%
d47e62d2b349aca45e42305ed6714efbe5ed61d9 PyTorch, 6.4%
d47e62d2b349aca45e42305ed6714efbe5ed61d9 Theano, 4.9%
d47e62d2b349aca45e42305ed6714efbe5ed61d9 Other Deep Learning Tools, 4.9%
d47e62d2b349aca45e42305ed6714efbe5ed61d9 DeepLearning4J, 3.4%
d47e62d2b349aca45e42305ed6714efbe5ed61d9 Microsoft Cognitive Toolkit (Prev. CNTK), 3.0%
d47e62d2b349aca45e42305ed6714efbe5ed61d9 Apache MXnet, 1.5%
d47e62d2b349aca45e42305ed6714efbe5ed61d9 Caffe, 1.5%
d47e62d2b349aca45e42305ed6714efbe5ed61d9 Caffe2, 1.2%
d47e62d2b349aca45e42305ed6714efbe5ed61d9 TFLearn, 1.1%
d47e62d2b349aca45e42305ed6714efbe5ed61d9 Torch, 1.0%

d47e62d2b349aca45e42305ed6714efbe5ed61d9Lasagne, 0.3%

大数据工具:Hadoop的使用率有所下降

今年的调查中,大约33%的投票者使用了大数据工具,要么是Hadoop,要么是Spark——比率大致与2017年相同,但Hadoop的使用率显著下降了——约为30%。

详细结果如下:

fe0c19c58c9105c76504402349a22234abf03098

编程语言

Python取代R语言成为数据科学/机器学习开发者中最受欢迎的编程语言,而且也远高于其他编程语言。SQL、Java、C/ C++的排名保持不变。

这是自KDnuggets网站开始进行这项调查以来,R的使用率首次下降。其他编程语言的使用率也有所下降。

以下是按受欢迎程度排序的主要编程语言。

d47e62d2b349aca45e42305ed6714efbe5ed61d9 Python, 65.6% (2017年是59.0%), 11% 上升
d47e62d2b349aca45e42305ed6714efbe5ed61d9 R, 48.5% (2017年是 56.6%), 14% 下降
d47e62d2b349aca45e42305ed6714efbe5ed61d9 SQL, 39.6% (2017年是 39.2%), 1% 上升
d47e62d2b349aca45e42305ed6714efbe5ed61d9 Java, 15.1% (2017年是 15.5%), 3% 下降
d47e62d2b349aca45e42305ed6714efbe5ed61d9 Unix, shell/awk/gawk, 9.2% (2017年是 10.8%), 15% 下降
d47e62d2b349aca45e42305ed6714efbe5ed61d9 Other programming and data languages, 6.9%, (2017年是 7.6%), -9% 下降
d47e62d2b349aca45e42305ed6714efbe5ed61d9 C/C++, 6.8%, (2017年是 7.1%), 3% 下降
d47e62d2b349aca45e42305ed6714efbe5ed61d9 Scala, 5.9%, (2017年是 8.3%), 29% 下降
d47e62d2b349aca45e42305ed6714efbe5ed61d9 Perl, 1.0% (2017年是 1.9%), 46% 下降
d47e62d2b349aca45e42305ed6714efbe5ed61d9 Julia, 0.7% (2017年是 1.2%), 45% 下降
d47e62d2b349aca45e42305ed6714efbe5ed61d9 Lisp, 0.3% (2017年是 0.4%), -25% 下降
d47e62d2b349aca45e42305ed6714efbe5ed61d9 Clojure, 0.2% (2017年是 0.3%), -38% 下降

d47e62d2b349aca45e42305ed6714efbe5ed61d9F, # 0.1% (2017年是 0.5%), -73% 下降


原文发布时间为:2018-06-1

本文作者:肖琴

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。

原文链接:【机器学习工具榜单】Tensorflow最多使用,Python 取代 R 成最受欢迎编程语言

相关文章
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
1398 55
|
机器学习/深度学习 算法 Python
机器学习特征筛选:向后淘汰法原理与Python实现
向后淘汰法(Backward Elimination)是机器学习中一种重要的特征选择技术,通过系统性地移除对模型贡献较小的特征,以提高模型性能和可解释性。该方法从完整特征集出发,逐步剔除不重要的特征,最终保留最具影响力的变量子集。其优势包括提升模型简洁性和性能,减少过拟合,降低计算复杂度。然而,该方法在高维特征空间中计算成本较高,且可能陷入局部最优解。适用于线性回归、逻辑回归等统计学习模型。
540 7
|
机器学习/深度学习 人工智能 算法
Scikit-learn:Python机器学习的瑞士军刀
想要快速入门机器学习但被复杂算法吓退?本文详解Scikit-learn如何让您无需深厚数学背景也能构建强大AI模型。从数据预处理到模型评估,从垃圾邮件过滤到信用风险评估,通过实用案例和直观图表,带您掌握这把Python机器学习的'瑞士军刀'。无论您是AI新手还是经验丰富的数据科学家,都能从中获取将理论转化为实际应用的关键技巧。了解Scikit-learn与大语言模型的最新集成方式,抢先掌握机器学习的未来发展方向!
1345 12
Scikit-learn:Python机器学习的瑞士军刀
|
机器学习/深度学习 数据可视化 算法
Python与机器学习:使用Scikit-learn进行数据建模
本文介绍如何使用Python和Scikit-learn进行机器学习数据建模。首先,通过鸢尾花数据集演示数据准备、可视化和预处理步骤。接着,构建并评估K近邻(KNN)模型,展示超参数调优方法。最后,比较KNN、随机森林和支持向量机(SVM)等模型的性能,帮助读者掌握基础的机器学习建模技巧,并展望未来结合深度学习框架的发展方向。
Python与机器学习:使用Scikit-learn进行数据建模
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
害虫识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了12种常见的害虫种类数据集【"蚂蚁(ants)", "蜜蜂(bees)", "甲虫(beetle)", "毛虫(catterpillar)", "蚯蚓(earthworms)", "蜚蠊(earwig)", "蚱蜢(grasshopper)", "飞蛾(moth)", "鼻涕虫(slug)", "蜗牛(snail)", "黄蜂(wasp)", "象鼻虫(weevil)"】 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Djan
782 1
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【蘑菇识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
蘑菇识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了9种常见的蘑菇种类数据集【"香菇(Agaricus)", "毒鹅膏菌(Amanita)", "牛肝菌(Boletus)", "网状菌(Cortinarius)", "毒镰孢(Entoloma)", "湿孢菌(Hygrocybe)", "乳菇(Lactarius)", "红菇(Russula)", "松茸(Suillus)"】 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,
1341 11
基于Python深度学习的【蘑菇识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
|
机器学习/深度学习 数据可视化 TensorFlow
Python 高级编程与实战:深入理解数据科学与机器学习
本文深入探讨了Python在数据科学与机器学习中的应用,介绍了pandas、numpy、matplotlib等数据科学工具,以及scikit-learn、tensorflow、keras等机器学习库。通过实战项目,如数据可视化和鸢尾花数据集分类,帮助读者掌握这些技术。最后提供了进一步学习资源,助力提升Python编程技能。
|
机器学习/深度学习 人工智能 算法
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
728 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
|
机器学习/深度学习 数据可视化 算法
Python 高级编程与实战:深入理解数据科学与机器学习
在前几篇文章中,我们探讨了 Python 的基础语法、面向对象编程、函数式编程、元编程、性能优化和调试技巧。本文将深入探讨 Python 在数据科学和机器学习中的应用,并通过实战项目帮助你掌握这些技术。
|
机器学习/深度学习 PyTorch TensorFlow
深度学习工具和框架详细指南:PyTorch、TensorFlow、Keras
在深度学习的世界中,PyTorch、TensorFlow和Keras是最受欢迎的工具和框架,它们为研究者和开发者提供了强大且易于使用的接口。在本文中,我们将深入探索这三个框架,涵盖如何用它们实现经典深度学习模型,并通过代码实例详细讲解这些工具的使用方法。
1274 0

推荐镜像

更多