sklearn实现KNN分类算法
Pyhthon Sklearn 机器学习库提供了 neighbors 模块,该模块下提供了 KNN 算法的常用方法,如下所示:
本节可以通过调用 KNeighborsClassifier 实现 KNN 分类算法。下面对 Sklearn 自带的“红酒数据集”进行 KNN 算法分类预测。最终实现向训练好的模型喂入数据,输出相应的红酒类别,示例代码如下:
类方法 | 说明 |
---|---|
KNeighborsClassifier | KNN 算法解决分类问题 |
KNeighborsRegressor | KNN 算法解决回归问题 |
RadiusNeighborsClassifier | 基于半径来查找最近邻的分类算法 |
NearestNeighbors | 基于无监督学习实现KNN算法 |
KDTree | 无监督学习下基于 KDTree 来查找最近邻的分类算法 |
BallTree | 无监督学习下基于 BallTree 来查找最近邻的分类算法 |
本节可以通过调用 KNeighborsClassifier 实现 KNN 分类算法。下面对 Sklearn 自带的“红酒数据集”进行 KNN 算法分类预测。最终实现向训练好的模型喂入数据,输出相应的红酒类别,示例代码如下:
#加载红酒数据集 from sklearn.datasets import load_wine #KNN分类算法 from sklearn.neighbors import KNeighborsClassifier #分割训练集与测试集 from sklearn.model_selection import train_test_split #导入numpy import numpy as np #加载数据集 wine_dataset=load_wine() #查看数据集对应的键 print("红酒数据集的键:\n{}".format(wine_dataset.keys())) print("数据集描述:\n{}".format(wine_dataset['data'].shape)) # data 为数据集数据;target 为样本标签 #分割数据集,比例为 训练集:测试集 = 8:2 X_train,X_test,y_train,y_test=train_test_split(wine_dataset['data'],wine_dataset['target'],test_size=0.2,random_state=0) #构建knn分类模型,并指定 k 值 KNN=KNeighborsClassifier(n_neighbors=10) #使用训练集训练模型 KNN.fit(X_train,y_train) #评估模型的得分 score=KNN.score(X_test,y_test) print(score) #给出一组数据对酒进行分类 X_wine_test=np.array([[11.8,4.39,2.39,29,82,2.86,3.53,0.21,2.85,2.8,.75,3.78,490]]) predict_result=KNN.predict(X_wine_test) print(predict_result) print("分类结果:{}".format(wine_dataset['target_names'][predict_result]))输出结果:
红酒数据集的键: dict_keys(['data', 'target', 'frame', 'target_names', 'DESCR', 'feature_names']) 数据集描述: (178, 13) 0.75 [1] 分类结果:['class_1']最终输入数据的预测结果为 1 类别。