对于这个问题其实也一直在争论不休,到底是用Python还是R,其实从来都没有一个答案。因为Python和R都在进化,而进化的过程会免不了的吸取别的语言的优势,而Python的长处在于机器学习,而R语言在于统计学习。而现在Python补足了很多的统计学习的库,而R也可以做机器学习,甚至Torch For R都有了。
其实选择哪个语言更加取决于你的思考方式是什么。比如说你来自于计算机或者工程背景,那么Python就适合你,因为它起初就是以程序员的角度被创造出来,因此你会更容易理解它。而如果你来自于统计背景,那毫无疑问R更适合你,很多的统计学出身的人会更喜欢R对待数据的方式。
对于现在的工作或者生产环境,其实掌握Python或者R的任意一种就足够了,因为编程语言不过是你思考方式的载体,而这个载体无论是C++,还是Java或者Python以及R都不是关键的。
R语言是由统计学家发明的,它的主要受众就是统计、数据挖掘以及分析师;而Python是一种更为通用的编程语言,也正是因为这个特性,它迅速的变成了这个世界上最为流行的几种语言之一。
而从入手难度来说,这两个语言其实在入门的时候半斤八两,都是属于比较简单的语言,再加上两者基本上都有非常详细且易懂的文档,入门的时候会非常的顺畅。但是代码量一旦增多之后,这时候的区别就显现出来了,那就是Python相对来说更适合写大规模的方便进行维护的代码。
这主要是因为Python和R在设计之初的理念的就不同。
通用性:Python是一种通用编程语言,设计时就考虑了可扩展性和模块化。这使得它可以容易地与其他系统和语言集成,而R主要是为统计计算和图形设计而创建的。
语法:Python的语法设计更为简洁和一致,这有助于提高代码的可读性和可维护性。相比之下,R语言有时可能出现不同的方法可以达到相同目的的情况,这可能会导致维护难度增加。
而在可用的库上面,其实这俩没有太大的区别,Python和R已经在互相学习中趋于一致了,其实你学哪个都行,就比如说数据收集、处理和可视化来说。
如果你做纯粹的统计工作,那么我建议你用R;如果你做机器学习,可以从Python开始,R比较难学,但是它的特性多,Python容易学,但是它还在不断的被开发,所以有时候不稳定。