ZBLOG

2024/4/25 11:27:32 任务1: 为MNIST数据集构建一个KNN分类器,找到最好的K值,查看其在测试集上的准确率. 绘制混淆矩阵。

好的,下面是一个基于KNN算法的MNIST数据集分类器,并计算最佳K值及在测试集上的准确率。同时,我们将绘制混淆矩阵以评估分类器性能。

import numpy as np
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, confusion_matrix
import matplotlib.pyplot as plt

# 载入MNIST数据集
X_train, y_train = mnist_reader.load_mnist(".", kind="train")
X_test, y_test = mnist_reader.load_mnist(".", kind="t10k")

# 创建KNN分类器对象
k_values = range(1, 11)  # 尝试不同的K值范围
accuracies = []  # 存储每个K值对应的准确率

for k in k_values:
    knn = KNeighborsClassifier(n_neighbors=k)
    knn.fit(X_train, y_train)
    
    # 在测试集上进行预测并计算准确率
    y_pred = knn.predict(X_test)
    accuracy = accuracy_score(y_test, y_pred)
    accuracies.append(accuracy)

best_k = k_values[np.argmax(accuracies)]  # 找到最佳K值

print(f"最佳K值: {best_k}")
print(f"在测试集上的准确率: {max(accuracies)}")

# 绘制混淆矩阵
confusion_mat = confusion_matrix(y_test, y_pred)
plt.figure(figsize=(10, 8))
plt.imshow(confusion_mat, cmap=plt.cm.Blues)
plt.title("Confusion Matrix")
plt.colorbar()
tick_marks = np.arange(10)
plt.xticks(tick_marks, range(10))
plt.yticks(tick_marks, range(10))
plt.xlabel("Predicted Label")
plt.ylabel("True Label")
plt.show()

运行以上代码,将会输出最佳K值和在测试集上的准确率,并显示绘制的混淆矩阵。请确保已经安装了numpysklearnmatplotlib库。


内容由零声教学AI助手提供,问题来源于学员提问

本站部分文章来源于网络,版权归原作者所有,如有侵权请联系站长删除。
转载请注明出处:https://golang.0voice.com/?id=14007

分享:
扫描分享到社交APP
上一篇
下一篇
发表列表
游客 游客
此处应有掌声~
评论列表

还没有评论,快来说点什么吧~

联系我们

在线咨询: 点击这里给我发消息

微信号:3007537140

上班时间: 10:30-22:30

关注我们
x

注册

已经有帐号?