代码拉取完成,页面将自动刷新
同步操作将从 mynameisi/OPTIMAL_KNN_MNIST_QUESTION 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
# TODO: 导入必要的库和模块
from sklearn.datasets import load_digits
from sklearn.neighbors import KNeighborsClassifier
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
import pickle
import numpy as np
from tqdm import tqdm
import time
# TODO: 加载数字数据集
digits=load_digits()
X=digits.data
y=digits.target
# TODO: 将数据集划分为训练集和测试集
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2,random_state=42)
# TODO: 初始化变量以存储最佳准确率,相应的k值和最佳knn模型
acc_best=0
knn_best=None
knn_model_best=None
# TODO: 初始化一个列表以存储每个k值的准确率
accs=[]
# TODO: 尝试从1到40的k值,对于每个k值,训练knn模型,保存最佳准确率,k值和knn模型
for i in tqdm(range(1,41),desc="program run:"):
knn=KNeighborsClassifier(n_neighbors=i)
knn.fit(X_train,y_train)
y_pred=knn.predict(X_test)
acc=accuracy_score(y_test,y_pred)
accs.append(acc)
if acc>acc_best:
knn_best=i
knn_model_best=knn
acc_best=acc
time.sleep(0.1)
# TODO: 将最佳KNN模型保存到二进制文件
with open('best_knn_model.pkl','wb')as f:
pickle.dump(knn_model_best,f)
# TODO: 打印最佳准确率和相应的k值
print("best accuracy:",acc_best)
print("relevant k:",knn_best)
x=np.linspace(1,40,40)
plt.plot(x,accs,color='blue')
plt.xlabel("k-value")
plt.ylabel("Accuracy")
plt.title("Accuracy of different k-value",fontsize=16)
plt.axvline(knn_best,color='r')
plt.plot(knn_best,acc_best,color='r',marker='o',markerfacecolor='red', markersize=5)
plt.text(knn_best+1,acc_best,'k=6,Accuracy=0.99',color='r',fontsize=12)
plt.savefig("accuracy_plot.pdf")
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。