Pandas教學

Pandas是一款開放源碼的BSD許可的Python庫,爲Python編程語言提供了高性能,易於使用的數據結構和數據分析工具。Pandas用於廣泛的領域,包括金融,經濟,統計,分析等學術和商業領域。在本教程中,我們將學習Python Pandas的各種功能以及如何在實踐中使用它們。

Python Pandas的官方網站是: http://pandas.pydata.org/ ,打開後如下所示 -

Python

Pandas庫的介紹

Pandas是一個開放源碼的Python庫,它使用強大的數據結構提供高性能的數據操作和分析工具。它的名字:Pandas是從Panel Data - 多維數據的計量經濟學(an Econometrics from Multidimensional data)。

2008年,爲滿足需要高性能,靈活的數據分析工具,開發商Wes McKinney開始開發Pandas

Pandas之前,Python主要用於數據遷移和準備。它對數據分析的貢獻更小。 Pandas解決了這個問題。 使用Pandas可以完成數據處理和分析的五個典型步驟,而不管數據的來源 - 加載,準備,操作,模型和分析。

Python Pandas用於廣泛的領域,包括金融,經濟,統計,分析等學術和商業領域。

Pandas的主要特點

  • 快速高效的DataFrame對象,具有默認和自定義的索引。
  • 將數據從不同文件格式加載到內存中的數據對象的工具。
  • 丟失數據的數據對齊和綜合處理。
  • 重組和擺動日期集。
  • 基於標籤的切片,索引和大數據集的子集。
  • 可以刪除或插入來自數據結構的列。
  • 按數據分組進行聚合和轉換。
  • 高性能合併和數據加入。
  • 時間序列功能。

讀者

本教程爲準備學習Pandas基礎知識和各種功能的人員而做準備的。它對數據清理和分析的人員特別有用。 完成本教程之後,將發現自己處於適度的專業知識水平,可以從中獲得更高水平的專業知識。

先決條件

要求對計算機編程術語有一個基本的瞭解。 對任何編程語言的基本瞭解是一個加分。Pandas庫使用NumPy的大部分功能。建議在繼續本教程之前,先閱讀NumPy的教程( http://www.yiibai.com/numpy/ )。