人工智能監督學習(迴歸)
迴歸是最重要的統計和機器學習工具之一。 我們認爲機器學習的旅程從迴歸開始並不是錯的。 它可以被定義爲使我們能夠根據數據做出決定的參數化技術,或者換言之,允許通過學習輸入和輸出變量之間的關係來基於數據做出預測。 這裏,依賴於輸入變量的輸出變量是連續值的實數。 在迴歸中,輸入和輸出變量之間的關係很重要,它有助於我們理解輸出變量的值隨輸入變量的變化而變化。 迴歸常用於預測價格,經濟,變化等。
在Python中構建迴歸器
在本節中,我們將學習如何構建單一以及多變量回歸器。
線性迴歸器/單變量回歸器
讓我們重點介紹一些必需的軟件包 -
import numpy as np
from sklearn import linear_model
import sklearn.metrics as sm
import matplotlib.pyplot as plt
現在,我們需要提供輸入數據,並將數據保存在名爲linear.txt
的文件中。
input = 'D:/ProgramData/linear.txt'
使用np.loadtxt
函數加載這些數據。
input_data = np.loadtxt(input, delimiter=',')
X, y = input_data[:, :-1], input_data[:, -1]
下一步將是培訓模型。下面給出培訓和測試樣本。
training_samples = int(0.6 * len(X))
testing_samples = len(X) - num_training
X_train, y_train = X[:training_samples], y[:training_samples]
X_test, y_test = X[training_samples:], y[training_samples:]
現在,我們需要創建一個線性迴歸器對象。
reg_linear = linear_model.LinearRegression()
用訓練樣本訓練對象。
reg_linear.fit(X_train, y_train)
下面使用測試數據做預測。
y_test_pred = reg_linear.predict(X_test)
現在繪製並可視化數據。
plt.scatter(X_test, y_test, color = 'red')
plt.plot(X_test, y_test_pred, color = 'black', linewidth = 2)
plt.xticks(())
plt.yticks(())
plt.show()
執行上面示例代碼,輸出以下結果 -
現在,我們可以計算線性迴歸的性能如下 -
print("Performance of Linear regressor:")
print("Mean absolute error =", round(sm.mean_absolute_error(y_test, y_test_pred), 2))
print("Mean squared error =", round(sm.mean_squared_error(y_test, y_test_pred), 2))
print("Median absolute error =", round(sm.median_absolute_error(y_test, y_test_pred), 2))
print("Explain variance score =", round(sm.explained_variance_score(y_test, y_test_pred),
2))
print("R2 score =", round(sm.r2_score(y_test, y_test_pred), 2))
線性迴歸器的性能輸出結果如下 -
Mean absolute error = 1.78
Mean squared error = 3.89
Median absolute error = 2.01
Explain variance score = -0.09
R2 score = -0.09
在上面的代碼中,我們使用了這些小數據源。 如果想要處理一些大的數據集,那麼可以使用sklearn.dataset
來導入更大的數據集。
2,4.82.9,4.72.5,53.2,5.56,57.6,43.2,0.92.9,1.92.4,
3.50.5,3.41,40.9,5.91.2,2.583.2,5.65.1,1.54.5,
1.22.3,6.32.1,2.8
多變量回歸
首先,讓我們導入一些必需的軟件包 -
import numpy as np
from sklearn import linear_model
import sklearn.metrics as sm
import matplotlib.pyplot as plt
from sklearn.preprocessing import PolynomialFeatures
現在,需要提供輸入數據,並將數據保存在名爲linear.txt
的文件中。
input = 'D:/ProgramData/Mul_linear.txt'
我們將通過使用np.loadtxt
函數加載這些數據。
input_data = np.loadtxt(input, delimiter=',')
X, y = input_data[:, :-1], input_data[:, -1]
下一步將是訓練模型; 會提供訓練和測試樣品數據。
training_samples = int(0.6 * len(X))
testing_samples = len(X) - num_training
X_train, y_train = X[:training_samples], y[:training_samples]
X_test, y_test = X[training_samples:], y[training_samples:]
現在,我們需要創建一個線性迴歸器對象。
reg_linear_mul = linear_model.LinearRegression()
用訓練樣本訓練對象。
reg_linear_mul.fit(X_train, y_train)
現在,最後需要用測試數據做預測。
y_test_pred = reg_linear_mul.predict(X_test)
print("Performance of Linear regressor:")
print("Mean absolute error =", round(sm.mean_absolute_error(y_test, y_test_pred), 2))
print("Mean squared error =", round(sm.mean_squared_error(y_test, y_test_pred), 2))
print("Median absolute error =", round(sm.median_absolute_error(y_test, y_test_pred), 2))
print("Explain variance score =", round(sm.explained_variance_score(y_test, y_test_pred), 2))
print("R2 score =", round(sm.r2_score(y_test, y_test_pred), 2))
線性迴歸器的性能輸出結果如下 -
Mean absolute error = 0.6
Mean squared error = 0.65
Median absolute error = 0.41
Explain variance score = 0.34
R2 score = 0.33
現在,我們將創建一個10階多項式並訓練迴歸器。並提供樣本數據點。
polynomial = PolynomialFeatures(degree = 10)
X_train_transformed = polynomial.fit_transform(X_train)
datapoint = [[2.23, 1.35, 1.12]]
poly_datapoint = polynomial.fit_transform(datapoint)
poly_linear_model = linear_model.LinearRegression()
poly_linear_model.fit(X_train_transformed, y_train)
print("\nLinear regression:\n", reg_linear_mul.predict(datapoint))
print("\nPolynomial regression:\n", poly_linear_model.predict(poly_datapoint))
線性迴歸 -
[2.40170462]
多項式迴歸 -
[1.8697225]
在上面的代碼中,我們使用了這些小數據。 如果想要一個大的數據集,那麼可以使用sklearn.dataset
來導入一個更大的數據集。
2,4.8,1.2,3.22.9,4.7,1.5,3.62.5,5,2.8,23.2,5.5,3.5,2.16,5,
2,3.27.6,4,1.2,3.23.2,0.9,2.3,1.42.9,1.9,2.3,1.22.4,3.5,
2.8,3.60.5,3.4,1.8,2.91,4,3,2.50.9,5.9,5.6,0.81.2,2.58,
3.45,1.233.2,5.6,2,3.25.1,1.5,1.2,1.34.5,1.2,4.1,2.32.3,
6.3,2.5,3.22.1,2.8,1.2,3.6