为何python攀上数据科学巅峰?调查显示Python超越R

news2024/2/27 14:45:14

根据KDnuggets 2017年最新调查,Python生态系统已经超过了R,成为了数据分析、数据科学与机器学习的第一大语言。本文对KDnuggets的此项调查结果做了介绍,并补充了一篇文章讲解为何Python能成为数据科学领域最受欢迎的语言。

根据KDnuggets 2017年最新调查,Python生态系统已经超过了R,成为了数据分析、数据科学与机器学习的第一大语言。本文对KDnuggets的此项调查结果做了介绍,并补充了一篇文章讲解为何Python能成为数据科学领域最受欢迎的语言。

Python vs R:2017 年调查结果

近日,KDnuggets 发起了一项调查,问题是:

你在 2016 年到现在是否使用过 R 语言、Python(以及它们的封装包),或是其他用于数据分析、数据科学与机器学习的工具?

预料之内的是,Python 并没有完全「吞噬」R 语言的空间,但这项基于 954 个参与者的投票显示,Python 生态系统在今年已经超越了 R 语言,成为了数据分析、数据科学和机器学习的第一大语言。

值得一提的是,在 2016 年的调查中,Python 还处于落后地位(34% 比 42%),在 2017 年,两者的对比是 41% 比 36%。

此外,参与这项调查的 KDnuggets 读者也有倾向于共同使用 Python 和 R 两种语言的趋势(12%),而使用其他工具的人则有所减少(从 16% 降至 11%)。最后,如果你的时间不是很紧张,并且又想快速的提高,最重要的是不怕吃苦,建议你可以联系维:762459510 ,那个真的很不错,很多人进步都很快,需要你不怕吃苦哦!大家可以去添加上看一下~

\

为何python攀上数据科学巅峰?调查显示Python超越R

\

图 1. 2016 年与 2017 年在数据分析、数据科学和机器学习上,Python、R、两者共同使用,以及其他平台的人数对比。

下面,让我们看看不同平台之间的转换。

\

为何python攀上数据科学巅峰?调查显示Python超越R

\

图 2. 2016 年与 2017 年间,数据分析、数据科学和机器学习上,Python、R、两者共同使用,以及其他平台的人数转换示意。

这张图看起来有点复杂,其中有两个主要方面都是 Python 获得胜利。

忠诚度:Python 的用户显得更加忠诚,有 91% 的 2016 年 Python 用户仍然在使用这个语言,而 R 语言的忠诚度为 74%,其他平台为 60%。

转换趋势:只有 5% 的 Python 用户转投 R 语言,反向转换的比例则是 10%。而对于在 2016 年使用两种语言的用户而言,只有 49% 的人仍在使用双平台,38% 现在只用 Python,而 11% 转移到了 R 语言上。

在 KDnuggets 2015 年的调查中,并没有提出「同时使用 Python 和 R 语言」的选项,所以下图的趋势线中,2016 年和 2017 年的数据按照如下公式进行了转换

  • Python=(Python 比例)+50%(同时使用 Python 和 R)
  • R=(R 比例)+50%(同时使用 Python 和 R)

我们可以看到,R 的使用份额正在逐渐下降(从 2015 年的 50% 降低到了 2017 年的 36%),而 Python 的比例则呈逐年上升趋势——从 2014 年的 23% 增加到了 2017 年的 47%。同时,其他平台的使用量在逐渐减少。最后,如果你的时间不是很紧张,并且又想快速的提高,最重要的是不怕吃苦,建议你可以联系维:762459510 ,那个真的很不错,很多人进步都很快,需要你不怕吃苦哦!大家可以去添加上看一下~
最后,如果你的时间不是很紧张,并且又想快速的提高,最重要的是不怕吃苦,建议你可以联系维:762459510 ,那个真的很不错,很多人进步都很快,需要你不怕吃苦哦!大家可以去添加上看一下~
\

为何python攀上数据科学巅峰?调查显示Python超越R

\

最后,让我们看看这次调查的参与者地区分布:

  • 美国/加拿大:40%
  • 欧洲:35%
  • 亚洲:12.5%
  • 拉丁美洲:6.2%
  • 非洲/中东:3.6%
  • 澳大利亚/新西兰:3.1%

为了简化图表,在下图中,同时使用两种语言与使用其他语言的比例被合并。

\

为何python攀上数据科学巅峰?调查显示Python超越R

\

图 4:分区域对比 Python、R 、其他,2016 对比 2017

我们在所有地区都发现了同样的模式:

  • Python 的比重增加了 8%-10%;
  • R 的比重下降了 2%-4%;
  • 其他平台的比重下降了 5%-7%。

Python 用户的未来看起来一片光明,但我们预期 R 和其他平台在未来会保持住一定比重,因为它们巨大的嵌入式基础。

Python 是如何上升到数据科学顶峰的

可以肯定地说,Python 是一个十分受欢迎的工具,它涵盖了各个行业的各种职业。由于它亲近性的语言、丰富的资源和框架以及它庞大硬件开发族群,Python 自然是开发人员们的首选工具。Packt 在 2017 年的技能调查显示,在不同职位的技术专业人员中,Python 从 2016 年的第二名上升成为用户最多的工具。我们向 Sebastian Raschka 提问:为什么不论是应用机器学习还是深度学习的研究者,亦或是 Packt 的畅销书 Python 机器学习的作者都转向了 Python 学习?这个语言的下一步将会是什么?他不得不承认:Python 已成为近二十年来最流行的语言。

艰难登顶:PYTHON 是如何成为数据科学通用语言的?

Python 是有史以来最流行的编程语言之一,这一点是毫无疑问的。但是最初发生的事情确实很难描述的,是语言本身还是对编程语言的爱。是否是我们首先为科学计算、数据科学以及机器学习开发出优秀的开源的数据库才推动了大家选择 Python 作为他们的工具,或是因为越来越多的人在使用 Python 我们才把这些开发出来。

无论哪一种是对的,有一件事是足够显而易见的:Python 是一种非常通用的语言,易于学习和使用。在我看来,这是今天它被如此普遍使用的原因。虽然科学计算的大多数算法都没有在纯 Python 中实现,Python 仍然是用于与 Fortran,C / C ++和其他语言中的非常有效的实现交互的优秀语言。

所谓的从计算高效的低级语言调用代码,以及 Python 为用户提供一个非常自然和直观的编程接口的这一事实可能是 Python 作为通用语言普及的重要原因之一,特别是在数据科学和机器学习社区中体现的更为明显。

未来的框架:我们应该关注什么工具、框架和数据库

Python 开发了许多有趣的库。作为一名数据科学家或机器学习从业者,我时常从 Python 核心科学堆栈中重点关注维护良好的工具。例如,NumPy 和 SciPy 是就是用于处理数据数组和科学计算的高效库。最后,如果你的时间不是很紧张,并且又想快速的提高,最重要的是不怕吃苦,建议你可以联系维:762459510 ,那个真的很不错,很多人进步都很快,需要你不怕吃苦哦!大家可以去添加上看一下~

当涉及严重的数据清洗时,我们可以使用多功能的 Pandas 包。Pandas 是一个开源库,可以为 Python 编程语言提供快速简化的数据处理和数据分析工具,它主要是为 Python 提供现实和高端的数据分析。我还建议使用 Matplotlib 进行数据可视化,Seaborn 还可以提供更多的绘图功能和更专门的绘图。此外 Scikit 学习是一个很好的通用机器学习工具,它为数据挖掘和分析提供了有效的工具。这可能是我最喜欢的一款了,因为它几乎可以为所有的基本机器学习算法和许多有用的数据处理工具提供一个非常好用的 API。

当然,我在自己的项目中发现了很多有用的库。当我需要额外的性能时,我首选的数据框架库是 Dask。Dask 是一个非常适合处理大型、难以装入内存的数据框架的库,它还能在多个处理器中进行并行计算。或者使用 TensorFlow、Keras 和 PyTorch,所有这些都非常适合实现深度学习模型。使用什么库取决于你的个人偏好和项目需求,但是一直以来都有很多方便有趣、使用 Python 开发的框架,关键是找到适合你自己的。

Python 的未来是什么样的?

在大多数人的眼里,Python 的未来非常光明。这个语言刚刚被 IEEE Spectrum 列为第一大编程语言。而 Packt 最近的调查也显示它是最近一段时期内科技界最为流行的工具。尽管在这里,我们主要从数据科学和机器学习的角度谈论 Python,但我们也会经常听说其他领域的人们也认为 Python 是一种功能丰富的语言,拥有大量的库和完整的生态系统。Python 或许不是所有问题的最佳工具,但对于想要「完成任务」的程序员来说,它被认为是一种「有效」的语言。

此外,虽然拥有大量库是 Python 的优势之一,但它的大多数开发包目前都得到了很好的维护——那些数据科学和机器学习库每天都有新特性与提升。例如 2006 年发起的 NumPy 项目,作为 Python 数据科学的核心库,最近它刚刚接受了价值 64.5 万美元的资助。

Python 及其相关库在我们的工作中扮演了重要角色,我非常感谢所有这些工具背后的开发者,没有这些开源库,Python 就没有今天。对于我们来说,Python 可以成为非常重要的工具,我希望它的用户们能够多考虑帮助开源社区的发展,不论文档修改、bug 修复还是新代码、新特性或新库,所有贡献都将帮助整个社区向前发展。因为这个富有活力的社区,Python 的未来有着光明的前景。

结语:资料获取地址 关注私信小编“资料”即可。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.dtcms.cn/news/show-75162.html

如若内容造成侵权/违法违规/事实不符,请联系七分地网进行投诉反馈,一经查实,立即删除!

相关文章

如何解决代码中 if…else 过多的问题

点击上方“方志朋”,选择“设为星标”回复”666“获取新整理的面试文章转自:博客园 作者:艾瑞克邵 www.cnblogs.com/eric-shao/p/10115577.html前言if...else 是所有高级编程语言都有的必备功能。但现实中的代码往往存在着过多的 if...els…

拿来就能用!Python 每天定时发送一句情话 | 原力计划

作者 | Baldwin_KeepMind出品 | CSDN博客我的日记 4月23日 晴你三天没回我的消息,在我孜孜不倦地骚扰下你终于舍得回我了,你说‘nmsl’我想这一定是有什么含义吧!噢!我恍然大悟,原来是尼美舒利颗粒。她知道我关节炎&am…

CSS 盒子模型(转)

CSS中, Box Model叫盒子模型(或框模型),Box Model规定了元素框处理元素内容(element content)、内边距(padding)、边框(border) 和 外边距(margin…

25 岁“天才少年”曹原再发一篇 Nature!9 个月的第三篇 Nature!

点击上方“视学算法”,选择加"星标"或“置顶”重磅干货,第一时间送达来源 | 微算云平台(Sapere Aude)、Nature、纳米人、安徽商报、新安晚报 、科学网、募格学术转自 | 募格学术新年伊始,2021年2月1日&#…

Linux主分区,扩展分区,逻辑分区的联系和区别

基本概念 硬盘分区有三种,主磁盘分区、扩展磁盘分区、逻辑分区。一个硬盘主分区至少有1个,最多4个,扩展分区可以没有,最多1个。且主分区扩展分区总共不能超过4个。逻辑分区可以有若干个。在windows下激活的主分区是硬盘的启动分区…

忘了python关键语句?这份备忘录拯救你的记忆

忘了Python关键语句?这份备忘录拯救你的记忆 今天要介绍的 Python 3 Cheat Sheet 由法国国家科学研究中心(CNRS)的法国机械工程与信息技术实验室(LIMSI)的工程师 Laurent Pointal 总结。这个简单的 Cheat Sheet 专注于…

干货|神经网络及理解反向传播

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达一、人工神经网络简述下面开始说神经网络。注意,当我们说N层神经网络的时候,我们没有把输入层算入(因为输入层只是输入数据&#xff09…

vPower系列1: vMotion-没有vMotion,虚拟化只是玩具

vPower今天开讲,第一篇vMotion。vMotion是虚拟化可以支撑核心应用的重要前提,没有vMotion,虚拟化只是玩具,只能应用在实验环境和开发环境。为什么这么说呢?为什么会有vMotion?vMotion解决了虚拟平台上的什么…

linux删除指定创建时间文件(文件夹)脚本

环境 解法 一个for循环 remove.sh #/bin/bash fileNamels --full-time | grep 2016 | awk {print$9} for file in $fileName do rm -rf $file; echo "************已删除$file************" #echo $file done 授予执行权直接跑即可。 转载于:https://www.cnblogs.com…

Mysql,再见吧!select * !

点击上方“方志朋”,选择“设为星标”回复”666“获取新整理的面试文章作者:AIOps应用程序慢如牛,原因多多,可能是网络的原因、可能是系统架构的原因,还有可能是数据库的原因。那么如何提高数据库SQL语句执行速度呢&am…

AjaxControltoolkit(工具包)安装步骤说明

本来打算做一个系统搜索中Ajax AutoComplete自动提示的效果,想尝试一下以前用AjaxControlToolkit中控件,在官网上下载一个AjaxControlToolkit2.0版本我尽然忘了如何安装.很是汗了一把. 看来人都是有惰性的,哪怕自己认为以前比较熟练自信的东西 如果时间一长不做回顾还是不行的 …

写代码神器!双屏敲代码飞起,包邮送一台!

写代码如果用多个屏是件很爽的事情,敲代码Bug多不多不重要,逼格必须先到位!所以,小编联合9位公众号主给大家送一款全新的金正(NINTAUS)20英寸直面黑色电脑显示器。写代码逼格高!赠送规则本次活动联合了9个号主一起赞助…

很多都是python很简单吗,但是要如何才能入门python并精通呢?

1,python怎么学 一般来说,Python几个月应该是可以入门了。如果你几个月还没有入门,一定是方法不对,要么就是偷懒了.我在公众号里面有一篇文章详细写过 ‘初学者上来不要学爬虫’,爬虫虽然非常有趣,但是不适合小白用户。这里我列出…

有哪些好看的CNN模型画法?

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达编辑:忆臻本文仅作为学术分享,如果侵权,会删文处理机器学习算法与自然语言处理报道有哪些好看的CNN模型画法?作者&#xff…

C语言回溯算法解决N皇后问题

回溯算法的模型是 x, not satisfy ? x-- : continue. 代码中x作列号&#xff0c;y[x]保存第x列上皇后放置的位置。 1 #include<stdio.h>2 #include<math.h>3 #define N 54 int position_check(int,int*);5 void print_board(int count,int* y);6 int main()7 {8 …

面试官吐槽:“Python程序员就是不行!”网友:我能把你面哭!

最近几年&#xff0c;Python莫名火了起来&#xff0c;很多公司都想赶上这“莫名”的热潮&#xff0c;招聘到大牛人才。但是&#xff0c;最近一个HR在社交网站的吐槽又火了&#xff1a;那么问题来了&#xff0c;市面上为什么鲜有企业满意的优秀的Python程序员&#xff1f;企业到…

告别「灭霸式审稿」,IJCAI-21 的投稿者爽到家!

点击上方“视学算法”&#xff0c;选择加"星标"或“置顶”重磅干货&#xff0c;第一时间送达转自 | 新智元编辑 | Q没有「灭霸式审稿」的IJCAI-21&#xff0c;你的论文中了吗&#xff1f;还记得去年的那封来自时任程序主席Christian Bessiere的邮件拒信吗&#xff1a…

50k大牛告诉你Python怎么学,10个特性带你快速了解python

前言 如果你是一个正在学习python的c、c or java程序员&#xff0c;又或者你是刚刚接触python&#xff0c;刚刚开始学习python&#xff0c;那么&#xff0c;请认真看完这10个语言特性&#xff0c;你会受益匪浅的。 关注转发私信小编“资料”即可领取2021最新全套python零基础入…

医疗人工智能前景——医学影像

点击上方“小白学视觉”&#xff0c;选择加"星标"或“置顶”重磅干货&#xff0c;第一时间送达作者&#xff1a;Arya医学图像AI&#xff08;博士&#xff09;在读&#xff0c;研究方向为unsupervised deep learning; multi-modal; PET-CT. 写这篇文章梳理一下学习思路…

TCP/IP 笔记 1.3 IP:网际协议

---恢复内容开始--- I P是T C P / I P协议族中最为核心的协议。所有的 T C P、U D P、I C M P及I G M P数据都以I P数据报格式传输。  不可靠( u n r e l i a b l e)的意思是它不能保证 I P数据报能成功地到达目的地。 I P仅提供最好的传输服务。如果发生某种错误时&#xff…