Python Data Analysis Library

pandas是BSD许可的开源库,为Python编程语言提供了高性能,易于使用的数据结构和数据分析工具.

熊猫NumFOCUS赞助的项目. 这将有助于确保将熊猫开发成功作为世界一流的开源项目,并有可能向该项目捐款 .

NumFOCUS Logo

v0.25.3 Final (October 31, 2019)

这是0.25.x系列中的次要错误修复版本,其中包括一些回归修复和错误修复. 我们建议所有用户升级到该版本.

有关所有更改的列表,请参阅完整的whatsnew .

该版本将在conda-forge和默认的conda通道中提供:

康达安装熊猫

或通过PyPI:

python -m pip install –升级熊猫

v0.25.2 Final (October 18, 2019)

这是0.25.x系列中的次要错误修复版本,其中包括一些回归修复和错误修复. 我们建议所有用户升级到该版本.

有关所有更改的列表,请参阅完整的whatsnew .

该版本将在conda-forge和默认的conda通道中提供:

康达安装熊猫

或通过PyPI:

python -m pip install –升级熊猫

Best way to Install

获取熊猫的最好方法是通过conda

conda install pandas

软件包适用于Windows,Linux和MacOS上所有受支持的python版本 .

车轮也可以上传到PyPI,并可以与

pip install pandas

Quick vignette

What problem does pandas solve?

长期以来,Python在处理数据和准备数据方面一直很出色,但在数据分析和建模方面却不那么出色. pandas帮助填补了这一空白,使您能够在Python中执行整个数据分析工作流,而不必切换到更特定于领域的语言(如R).

与出色的IPython工具包和其他库结合使用,在Python中进行数据分析的环境在性能,生产力和协作能力方面表现出色.

除了线性回归和面板回归之外, pandas没有实现任何重要的建模功能; 为此,请查看statsmodelsscikit-learn . 为了使Python成为一流的统计建模环境,还需要做更多的工作,但是我们正在朝着这个目标迈进.

What do our users have to say?

AQR Capital Management Logo
Roni Israelov博士
投资组合经理

熊猫使我们可以将更多的精力放在研究上,而不必在编程上. 我们发现熊猫易于学习,易于使用和易于维护. 最重要的是,它提高了我们的生产力."

AppNexus Logo
大卫·希姆罗德
优化与分析总监

" 熊猫是弥合临时分析的快速迭代与生产质量代码之间差距的理想工具. 如果您希望在跨学科的工程师,数学家和分析师组织中使用一种工具,那就别无所求."

Datadog Logo
奥利维尔·波梅尔(Olivier Pomel)
CEO
"我们使用熊猫在生产服务器上处理时间序列数据. 其API的简洁性和优雅性以及对大量数据集的高水平性能,使其成为我们的理想选择."

Library Highlights

  • A fast and efficient DataFrame object for data manipulation with integrated indexing;
  • 用于在内存数据结构和不同格式之间读取和写入数据的工具:CSV和文本文件,Microsoft Excel,SQL数据库和快速HDF5格式;
  • 智能数据对齐丢失数据的集成处理:在计算中实现基于标签的自动对齐,并轻松将杂乱数据处理为有序形式;
  • 灵活地重塑和旋转数据集;
  • 基于智能标签的切片花式索引和大数据集子集;
  • 可以从数据结构中插入和删除列,以实现大小可变性
  • 借助强大的分组引擎汇总或转换数据,从而允许对数据集进行拆分应用合并操作;
  • 高性能的数据集合并和合并
  • 分层轴索引为在低维数据结构中处理高维数据提供了一种直观的方式.
  • 时间序列功能:日期范围生成和频率转换,移动窗口统计信息,移动窗口线性回归,日期移动和滞后. 甚至创建特定于域的时间偏移并加入时间序列,而不会丢失数据;
  • 通过使用Cython或C编写的关键代码路径对性能进行了高度优化 .
  • 带有熊猫的 Python已在广泛的学术和商业领域中使用,包括金融,神经科学,经济学,统计学,广告,Web分析等.