6.Anaconda
相信大多数 Python 的初学者们都曾为环境问题而头疼不已,但你并不孤独,大家都是这么折腾过来的,打算学习 Python 来做数据分析的你,是不是在开始时就遇到各种麻烦呢?仅仅是安装数据计算库估计就耗尽了所有的热情。
这里推荐使用 Anaconda 来管理你的安装环境和各种工具包。
Anaconda是数据分析的Python发行版本,集成了几百个专门做数据分析的库,像numpy,pandas,matplotlib,scikit-learn等常用的库都有集成,而且还提供跨平台的安装包,实在是做数据分析不二的选择
7.IPython 、Spyder
它是一个增强的Python shell,目的是提高编写,测试,调试Python代码的速度,
支持变量自动补全,自动缩进,支持bash shell命令,内置了许多很有用的功能和函数。学习ipython将会让我们以一种更高的效率来使用Python.同时它也是利用Python进行科学计算和交互可视化的一个最佳的平台。
IPython提供了两个主要的组件:
一个强大的Python交互式shell
供Jupyter notebooks使用的一个Jupyter内核(IPython notebook)
Spyder是anaconda自带的集成开发环境,专门针对数据处理而优化,集成了ipython控制台,可以方便查看数据处理结果及数据可视化
8.NumPy
Python 数据科学十大利器,你用过几个?
数据科学的核心库,是其他高级数据分析库的基础和依赖,Numpy不提供高级数据分析功能,可以更加深刻的理解Numpy数组和面向数组的计算。
umpy提供了两种基本的对象:ndarray和ufunc.
ndarray是存储单一数据类型的多维数组,而ufunc是能够对数组进行处理的函数。
Numpy的功能:
N维数组,一种快速、高效使用内存的多维数组,他提供矢量化数学运算。
可以不需要使用循环,就能对整个数组内的数据进行标准数学运算。
非常便于传送数据到用低级语言编写(CC++)的外部库,也便于外部库以Numpy数组形式返回数据。
9.Scipy
Scipy是一款方便、易于使用、专门为科学和工程设计的Python包,它包括统计、优化、整合、线性代数模块、傅里叶变换、信号和图像处理、常微分方程求解器等。Scipy依赖于Numpy,并提供许多对用户友好的和有效的数值例程,如数值积分和优化。
10.Pandas
Python 数据科学十大利器,你用过几个?
Pandas是Python的一个数据分析包,Pandas最初被用作金融数据分析工具而开发出来,因此Pandas为时间序列分析提供了很好的支持。
Pandas是为了解决数据分析任务而创建的,Pandas纳入了大量的库和一些标准的数据模型,提供了高效的操作大型数据集所需要的工具。Pandas包含了高级数据结构,以及让数据分析变得快速、简单的工具,提供了大量快速便捷的处理数据的函数和方法。它建立在Numpy之上,使得Numpy应用变得简单。
Pandas在数据探索,数据清洗方面表现的更加出色,可以很容易的处理缺失值,异常值,筛选或合并数据集
Pandas是进行数据清洗、整理的最好工具。
以上就是潍坊IT培训给大家做的内容详解,更多关于IT知识的学习,请继续关注潍坊IT培训。