1 Star 0 Fork 246

姜雨森/OPTIMAL_KNN_MNIST_QUESTION

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
optimal_knn.py 1.90 KB
一键复制 编辑 原始数据 按行查看 历史
姜雨森 提交于 2024-09-05 23:39 . 2024/9/5
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score
import pickle
from tqdm import tqdm
import matplotlib
# 设置字体以支持中文
matplotlib.rcParams['font.sans-serif'] = ['SimHei']
matplotlib.rcParams['axes.unicode_minus'] = False
# 加载手写数字数据集
digits = load_digits()
X = digits.data
y = digits.target
# 将数据集划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 初始化变量以存储最佳准确率、相应的k值和最佳knn模型
best_accuracy = 0
best_k = 0
best_knn_model = None
# 初始化一个列表以存储每个k值的准确率
accuracies = []
# 尝试从1到40的k值,对于每个k值,训练knn模型,保存最佳准确率、k值和knn模型
for k in tqdm(range(1, 41)):
knn = KNeighborsClassifier(n_neighbors=k)
knn.fit(X_train, y_train)
y_pred = knn.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
accuracies.append(accuracy)
if accuracy > best_accuracy:
best_accuracy = accuracy
best_k = k
best_knn_model = knn
# 将最佳KNN模型保存到二进制文件
with open('best_knn_model.pkl', 'wb') as f:
pickle.dump(best_knn_model, f)
# 打印最佳准确率和相应的k值
print(f"最佳准确率: {best_accuracy * 100:.2f}%")
print(f"最佳k值: {best_k}")
# 绘制准确率随k值变化的折线图,并保存为PDF文件
plt.figure(figsize=(10, 6))
plt.plot(range(1, 41), accuracies, marker='o')
plt.axvline(x=best_k, color='r', linestyle='--')
plt.text(best_k, best_accuracy, f'k={best_k}\naccuracy={best_accuracy:.2f}', color='red')
plt.xlabel('k值')
plt.ylabel('准确率')
plt.title('K值与准确率的关系')
plt.savefig('accuracy_plot.pdf')
plt.show()
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/wenwu86/optimal_knn_mnist_question.git
git@gitee.com:wenwu86/optimal_knn_mnist_question.git
wenwu86
optimal_knn_mnist_question
OPTIMAL_KNN_MNIST_QUESTION
main

搜索帮助