Pandas可視化

基本繪圖:繪圖

Series和DataFrame上的這個功能只是使用matplotlib庫的plot()方法的簡單包裝實現。參考以下示例代碼 -

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('2018/12/18',
   periods=10), columns=list('ABCD'))

df.plot()

執行上面示例代碼,得到以下結果 -

Pandas可視化

如果索引由日期組成,則調用gct().autofmt_xdate()來格式化x軸,如上圖所示。

我們可以使用xy關鍵字繪製一列與另一列。

繪圖方法允許除默認線圖之外的少數繪圖樣式。 這些方法可以作爲plot()kind關鍵字參數提供。這些包括 -

  • barbarh爲條形
  • hist爲直方圖
  • boxplot爲盒型圖
  • area爲「面積」
  • scatter爲散點圖

條形圖

現在通過創建一個條形圖來看看條形圖是什麼。條形圖可以通過以下方式來創建 -

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
df.plot.bar()

執行上面示例代碼,得到以下結果 -

Pandas可視化

要生成一個堆積條形圖,通過指定:pass stacked=True -

import pandas as pd
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
df.plot.bar(stacked=True)

執行上面示例代碼,得到以下結果 -

Pandas可視化

要獲得水平條形圖,使用barh()方法 -

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])

df.plot.barh(stacked=True)

執行上面示例代碼,得到以下結果 -

Pandas可視化

直方圖

可以使用plot.hist()方法繪製直方圖。我們可以指定bins的數量值。

import pandas as pd
import numpy as np

df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])

df.plot.hist(bins=20)

執行上面示例代碼,得到以下結果 -

Pandas可視化

要爲每列繪製不同的直方圖,請使用以下代碼 -

import pandas as pd
import numpy as np

df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])

df.hist(bins=20)

執行上面示例代碼,得到以下結果 -

Pandas可視化

箱形圖

Boxplot可以繪製調用Series.box.plot()DataFrame.box.plot()DataFrame.boxplot()來可視化每列中值的分佈。

例如,這裏是一個箱形圖,表示對[0,1)上的統一隨機變量的10次觀察的五次試驗。

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box()

執行上面示例代碼,得到以下結果 -

Pandas可視化

區域塊圖形

可以使用Series.plot.area()DataFrame.plot.area()方法創建區域圖形。

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df.plot.area()

執行上面示例代碼,得到以下結果 -

Pandas可視化

散點圖形

可以使用DataFrame.plot.scatter()方法創建散點圖。

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd'])
df.plot.scatter(x='a', y='b')

執行上面示例代碼,得到以下結果 -

Pandas可視化

餅狀圖

餅狀圖可以使用DataFrame.plot.pie()方法創建。

import pandas as pd
import numpy as np

df = pd.DataFrame(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], columns=['x'])
df.plot.pie(subplots=True)

執行上面示例代碼,得到以下結果 -

Pandas可視化