Python P值

p值是關於假設的強度。 我們基於一些統計模型建立假設,並使用p值比較模型的有效性。 獲得p值的一種方法是使用T檢驗。

這是對零假設的雙側檢驗,即獨立觀察值'a'的樣本的期望值(平均值)等於給定的總體均值popmean。看看下面的一個例子。

from scipy import stats
rvs = stats.norm.rvs(loc = 5, scale = 10, size = (50,2))
print (stats.ttest_1samp(rvs,5.0))

執行上面示例代碼,得到以下結果 -

Ttest_1sampResult(statistic = array([-1.40184894, 2.70158009]),
pvalue = array([ 0.16726344, 0.00945234]))

比較兩個樣本

在下面的例子中,有兩個樣本可以來自相同或不同的分佈,想要測試這些樣本是否具有相同的統計特性。

ttest_ind - 計算兩個獨立樣本得分的T檢驗。 對於兩個獨立樣本具有相同平均(預期)值的零假設,這是一個雙側檢驗。 該測試假設人口默認具有相同的差異。

如果觀察到來自相同或不同人羣的兩個獨立樣本,那麼可以使用這個測試。 讓我們來看下面的一個例子。

from scipy import stats
rvs1 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
rvs2 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
print (stats.ttest_ind(rvs1,rvs2))

執行上面示例代碼,得到以下結果 -

Ttest_indResult(statistic = -0.67406312233650278, pvalue = 0.50042727502272966)

可以使用相同長度的新數組進行測試,但具有不同的含義。 在loc中使用不同的值並測試相同的值。