Pandas可視化
基本繪圖:繪圖
Series和DataFrame上的這個功能只是使用matplotlib
庫的plot()
方法的簡單包裝實現。參考以下示例代碼 -
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('2018/12/18',
periods=10), columns=list('ABCD'))
df.plot()
執行上面示例代碼,得到以下結果 -
如果索引由日期組成,則調用gct().autofmt_xdate()
來格式化x
軸,如上圖所示。
我們可以使用x
和y
關鍵字繪製一列與另一列。
繪圖方法允許除默認線圖之外的少數繪圖樣式。 這些方法可以作爲plot()
的kind
關鍵字參數提供。這些包括 -
-
bar
或barh
爲條形 -
hist
爲直方圖 -
boxplot
爲盒型圖 -
area
爲「面積」 -
scatter
爲散點圖
條形圖
現在通過創建一個條形圖來看看條形圖是什麼。條形圖可以通過以下方式來創建 -
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
df.plot.bar()
執行上面示例代碼,得到以下結果 -
要生成一個堆積條形圖,通過指定:pass stacked=True -
import pandas as pd
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
df.plot.bar(stacked=True)
執行上面示例代碼,得到以下結果 -
要獲得水平條形圖,使用barh()
方法 -
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
df.plot.barh(stacked=True)
執行上面示例代碼,得到以下結果 -
直方圖
可以使用plot.hist()
方法繪製直方圖。我們可以指定bins
的數量值。
import pandas as pd
import numpy as np
df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
df.plot.hist(bins=20)
執行上面示例代碼,得到以下結果 -
要爲每列繪製不同的直方圖,請使用以下代碼 -
import pandas as pd
import numpy as np
df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
df.hist(bins=20)
執行上面示例代碼,得到以下結果 -
箱形圖
Boxplot可以繪製調用Series.box.plot()
和DataFrame.box.plot()
或DataFrame.boxplot()
來可視化每列中值的分佈。
例如,這裏是一個箱形圖,表示對[0,1)
上的統一隨機變量的10
次觀察的五次試驗。
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box()
執行上面示例代碼,得到以下結果 -
區域塊圖形
可以使用Series.plot.area()
或DataFrame.plot.area()
方法創建區域圖形。
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df.plot.area()
執行上面示例代碼,得到以下結果 -
散點圖形
可以使用DataFrame.plot.scatter()
方法創建散點圖。
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd'])
df.plot.scatter(x='a', y='b')
執行上面示例代碼,得到以下結果 -
餅狀圖
餅狀圖可以使用DataFrame.plot.pie()
方法創建。
import pandas as pd
import numpy as np
df = pd.DataFrame(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], columns=['x'])
df.plot.pie(subplots=True)
執行上面示例代碼,得到以下結果 -