关于Scikit-learn机器学习的笔记——第二篇
视频教程:【莫烦Python】Scikit-learn (sklearn) 优雅地学会机器学习
在第一篇中,我们采用了鸢尾花的数据集进行了测试,这次我们采用boston的数据集进行测试,boston也是sklearn自带的数据库
程序示例:
1 2 3 4 5 6 7 8 9 10 11 12
| from sklearn import datasets from sklearn.linear_model import LinearRegression
loaded_data=datasets.load_boston() data_X=loaded_data.data data_y=loaded_data.target
modele=LinearRegression() modele.fit(data_X,data_y)
print(modele.predict(data_X[:4,:])) print(data_y[:4])
|
输出结果:
1 2
| [30.00384338 25.02556238 30.56759672 28.60703649] [24. 21.6 34.7 33.4]
|
可以看到,预测的结果并没有那么准确,因为我们并没有将对模型进行改善,所以作为入门学习,采用sklearn默认的模型就足够了
接下来我们创造一些数据,赋值给X,y
程序示例:
1 2 3 4 5 6 7
| from sklearn import datasets from sklearn.linear_model import LinearRegression import matplotlib.pyplot as plt
X,y=datasets.make_regression(n_samples=100,n_features=1,n_targets=1,noise=1) plt.scatter(X,y) plt.show()
|
输出结果:

若noise变大,noise=10,离散会更大
noise=10的输出结果:

运用我们创造出的数据进行机器学习,可以让我们更有目的性的去进行训练