Pandas教學
Pandas環境安裝配置
Pandas數據結構
Pandas快速入門
Pandas系列
Pandas數據幀(DataFrame)
Pandas面板(Panel)
Pandas基本功能
Pandas描述性統計
Pandas函數應用
Pandas重建索引
Pandas迭代
Pandas排序
Pandas字符串和文本數據
Pandas選項和自定義
Pandas索引和選擇數據
Pandas統計函數
Pandas窗口函數
Pandas聚合
Pandas缺失數據
Pandas分組(GroupBy)
Pandas合併/連接
Pandas級聯
Pandas日期功能
Pandas時間差(Timedelta)
Pandas分類數據
Pandas可視化
Pandas IO工具
Pandas稀疏數據
Pandas注意事項&竅門
Pandas與SQL比較
Pandas數據結構
Pandas處理以下三個數據結構 -
- 系列(
Series
) - 數據幀(
DataFrame
) - 面板(
Panel
)
這些數據結構構建在Numpy數組之上,這意味着它們很快。
維數和描述
考慮這些數據結構的最好方法是,較高維數據結構是其較低維數據結構的容器。 例如,DataFrame
是Series
的容器,Panel
是DataFrame
的容器。
數據結構
維數
描述
系列
1
1
D標記均勻數組,大小不變。
數據幀
2
一般2
D標記,大小可變的表結構與潛在的異質類型的列。
面板
3
一般3
D標記,大小可變數組。
構建和處理兩個或更多個維數組是一項繁瑣的任務,用戶在編寫函數時要考慮數據集的方向。 但是使用Pandas數據結構,減少了用戶的思考。
例如,使用表格數據(DataFrame
),在語義上更有用於考慮索引(行)和列,而不是軸0
和軸1
。
可變性
所有Pandas數據結構是值可變的(可以更改),除了系列都是大小可變的。系列是大小不變的。
注 -
DataFrame
被廣泛使用,是最重要的數據結構之一。面板使用少得多。
系列
系列是具有均勻數據的一維數組結構。例如,以下系列是整數:10
,23
,56
,...
的集合。
關鍵點
- 均勻數據
- 尺寸大小不變
- 數據的值可變
數據幀
數據幀(DataFrame)是一個具有異構數據的二維數組。 例如,
姓名
年齡
性別
等級
Maxsu
25
男
4.45
Katie
34
女
2.78
Vina
46
女
3.9
Lia
女
x女
4.6
上表表示具有整體績效評級組織的銷售團隊的數據。數據以行和列表示。每列表示一個屬性,每行代表一個人。
列的數據類型
上面數據幀中四列的數據類型如下:
列
類型
姓名
字符串
年齡
整數
性別
字符串
等級
浮點型
關鍵點
- 異構數據
- 大小可變
- 數據可變
面板
面板是具有異構數據的三維數據結構。在圖形表示中很難表示面板。但是一個面板可以說明爲DataFrame
的容器。
關鍵點
- 異構數據
- 大小可變
- 數據可變