代码拉取完成,页面将自动刷新
同步操作将从 mynameisi/OPTIMAL_KNN_MNIST_QUESTION 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
# TODO: 导入必要的库和模块
# TODO: 加载数字数据集
# TODO: 将数据集划分为训练集和测试集
# TODO: 初始化变量以存储最佳准确率,相应的k值和最佳knn模型
# TODO: 初始化一个列表以存储每个k值的准确率
# TODO: 尝试从1到40的k值,对于每个k值,训练knn模型,保存最佳准确率,k值和knn模型
# TODO: 将最佳KNN模型保存到二进制文件
# TODO: 打印最佳准确率和相应的k值
# 导入必要的库和模块
import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score
import joblib
from tqdm import tqdm
# 加载数字数据集
digits = datasets.load_digits()
# 将数据集划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(digits.data, digits.target, test_size=0.2, random_state=42)
# 初始化变量以存储最佳准确率,相应的k值和最佳knn模型
best_accuracy = 0.0
best_k = 0
best_model = None
# 初始化一个列表以存储每个k值的准确率
accuracies = []
# 尝试从1到40的k值,对于每个k值,训练knn模型,保存最佳准确率,k值和knn模型
for k in tqdm(range(1, 41), desc="Training KNN models"):
knn = KNeighborsClassifier(n_neighbors=k)
knn.fit(X_train, y_train)
predictions = knn.predict(X_test)
current_accuracy = accuracy_score(y_test, predictions)
accuracies.append(current_accuracy)
if current_accuracy > best_accuracy:
best_accuracy = current_accuracy
best_k = k
best_model = knn
# 将最佳KNN模型保存到二进制文件
joblib.dump(best_model, 'best_knn_model.pkl')
# 绘制准确率随 k 值变化的图形
plt.figure(figsize=(10, 6))
plt.plot(range(1, 41), accuracies, marker='o', linestyle='-', color='b')
plt.xlabel('k value') # 修改为英文
plt.ylabel('Accuracy')
plt.title('Accuracy vs. k Value')
plt.grid(True)
# 添加一条垂直的红线标记最佳 k 值
plt.axvline(x=best_k, color='r', linestyle='--', label=f'Best k={best_k}, Accuracy={best_accuracy:.4f}')
plt.legend()
# 显示图形并保存为 PDF 文件
plt.savefig('accuracy_plot.pdf')
plt.show()
# 打印最佳准确率和相应的k值
print(f"Best accuracy: {best_accuracy}, with k = {best_k}")
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。