Python箱形圖

箱線圖是數據集中數據分佈情況的一種度量。 它將數據集劃分爲三個四分位數。 該圖表示數據集中的最小值,最大值,中位數,第一四分位數和第三四分位數。 通過爲每個數據集繪製箱形圖來比較跨數據集的數據分佈也很有用。

繪製箱線圖

Boxplot可以繪製調用Series.box.plot()DataFrame.box.plot()DataFrame.boxplot()以可視化每列中值的分佈。

例如,這裏是一個箱形圖,表示對[0,1)上的統一隨機變量的10次觀察的五次試驗。

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box(grid='True')

執行上面示例代碼,得到以下結果 -

Python箱形圖