本站分享:AI、大数据、数据分析师培训认证考试,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训

Python 在数据分析工作中的地位与 R 语言、SAS、SPSS 比较如何?

python培训 cdadata 3550℃

Python与R不同,Python是一门多功能的语言。数据统计是更多是通过第三方包来实现的。

具体来说,我常用的Python在统计上面的Package有这样一些

1.Numpy与Scipy。这两个包是Python之所以能在数据分析占有一席之地的重要原因。其中Numpy封装了基础的矩阵和向量的操作,而Scipy则在Numpy的基础上提供了更丰富的功能,比如各种统计常用的分布和算法都能迅速的在Scipy中找到。

2.Matplotlib。这个Package主要是用来提供数据可视化的,其功能强大,生成的图标可以达到印刷品质,在各种学术会议里面出镜率不低。依托于Python,可定制性相对于其他的图形库更高。还有一个优点是提供互动化的数据分析,可以动态的缩放图表,用做adhoc analysis非常合适。

3.Scikit Learn。非常好用的Machine Learning库,适合于用于快速定制原型。封装几乎所有的经典算法(神经网络可能是唯一的例外,不过这个有Pylearn2来补充),易用性极高。

4.Python标准库。这里主要是体现了Python处理字符串的优势,由于Python多功能的属性和对于正则表达式的良好支持,用于处理text是在合适不过的了。

基本上就日常使用就涉及这些。符号运算等等也有Sympy和Theano等强力第三方库来支持。总结,Python在你列举这些里面是综合功能最强大的,但是这些功能分散在第三方库里面,没有得到有机的整合,相应的学习成本会较高。

【pengwang的回答(23票)】:

python与R相比速度要快。python可以直接处理上G的数据;R不行,R分析数据时需要先通过数据库把大数据转化为小数据(通过groupby)才能交给R做分析,因此R不可能直接分析行为详单,只能分析统计结果。Python=R+SQL/Hive

R的优势在于有包罗万象的统计函数可以调用,特别是在时间序列分析方面(主要用在金融分析与趋势预测)无论是经典还是前沿的方法都有相应的包直接使用;相比python在这方面贫乏不少。

Python的优势在于其胶水语言的特性,一些底层用C写的算法封装在python包里后性能非常高效(Python的数据挖掘包Orange canve 中的决策树分析50万用户10秒出结果,用R几个小时也出不来,8G内存全部占满)。

总的来说Python是一套比较平衡的语言,各方面都可以,而R是在统计方面比较突出。但是数据分析其实不仅仅是统计,前期的数据收集,数据处理,数据抽样,数据聚类,以及比较复杂的数据挖掘算法,数据建模等等这些任务,只要是100M以上的数据,R都很难胜任,但是Python却基本胜任。

补充一下:

Python有专门的数据分析包Pandas用来完成类似SQL的功能,不过Pandas是会把数据都load到内存里,如果数据太大(2G以上)需要想办法分chunk分析,或者用pytables/pyh5转换为hdf5格式的文件在硬盘上分析。

另外如果是windows环境的话,建议用winpython,上面提到的这些包会自带。当然更丰富的是pythonxy可惜这个只有32位的。

SAS和SPSS是商业数据分析软件,本屌从来没用过。

【知乎用户的回答(2票)】:

详情请看url详情请看url

SAS vs. R (vs. Python)

【陈丹奕的回答(2票)】:

说说我的经验吧,我的工作偏向于数据分析建模,所以PYTHON主要用来处理一些数据,比如做名称关键字的切词统计。SPSS主要用于对处理好的数据作分析,生成报告。

【马光的回答(3票)】:

首先,我觉得用python来和r比较是蛮合理的,同时作为开源语言,有着强大的类库和开源文档支持。而用python来和SASSPSS比,不是很合理,作为主攻“开箱即用”的商业软件,UI、适用性等都可能重要,大多用商业软件的都是图方便,比如你要作为ARIMA,用软件就更方便,用开源语言还得编程。

工作中的适用性就得看工作要求,我一直学校R,统计制图很强大,直接生成印刷级别的图像。python的话,只知一二,不敢献丑。

所以,用开源工具还是用商业软件,就得看自己的风格,要便捷还是要全面?!

【栾生的回答(0票)】:

没有很大的数据。目前一般几十兆是大的,所以R基本够用。不过迈向基因组选择育种,数据都是上百兆的,不知道R如何?听说有不少针对大数据的R包,不知道效果如何。

转载请注明:数据分析 » Python 在数据分析工作中的地位与 R 语言、SAS、SPSS 比较如何?

喜欢 (0)or分享 (0)