ZBLOG

寻找案例 用Python做决策树案例 生成代码

以下是一个使用Python编写的决策树案例代码示例:

  1. import pandas as pd
  2. from sklearn.tree import DecisionTreeClassifier
  3. from sklearn.model_selection import train_test_split
  4. from sklearn import metrics
  5. # 读取数据集
  6. data = pd.read_csv("iris.csv")
  7. # 将目标变量从文本转换为数字
  8. data['species'] = pd.factorize(data.species)[0]
  9. # 将特征列和目标变量分离
  10. X = data.drop('species', axis=1)
  11. y = data['species']
  12. # 将数据集拆分为训练集和测试集
  13. X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
  14. # 创建决策树分类器对象,并将其拟合到训练数据上
  15. clf = DecisionTreeClassifier()
  16. clf.fit(X_train,y_train)
  17. # 预测测试集上的类别,并计算准确度得分
  18. y_pred = clf.predict(X_test)
  19. print("Accuracy:",metrics.accuracy_score(y_test, y_pred))
  20. # 可视化决策树模型
  21. from sklearn.tree import export_graphviz
  22. from IPython.display import Image
  23. import pydotplus
  24. dot_data = export_graphviz(clf, out_file=None,
  25. feature_names=X.columns,
  26. class_names=['setosa', 'versicolor', 'virginica'],
  27. filled=True, rounded=True,
  28. special_characters=True)
  29. graph = pydotplus.graph_from_dot_data(dot_data)
  30. Image(graph.create_png())

在上面的代码中,我们首先使用Pandas库读取名为“iris.csv”的数据集。然后,我们将目标变量从文本转换为数字,并将特征列和目标变量分离。接下来,我们使用train_test_split()函数将数据集拆分为训练集和测试集。

然后,我们创建了一个DecisionTreeClassifier对象,并使用fit()方法将其拟合到训练数据上。我们使用测试集上的数据预测类别,并计算准确度得分。

最后,我们使用export_graphviz()函数可视化决策树模型,并用Pydotplus库渲染它。您可以在代码中修改特征名称、目标变量名称和类别名称以适应您自己的数据集。

本站部分文章来源于网络,版权归原作者所有,如有侵权请联系站长删除。
转载请注明出处:https://golang.0voice.com/?id=6268

分享:
扫描分享到社交APP
上一篇
下一篇
发表列表
游客 游客
此处应有掌声~
评论列表

还没有评论,快来说点什么吧~

联系我们

在线咨询: 点击这里给我发消息

微信号:3007537140

上班时间: 10:30-22:30

关注我们
x

注册

已经有帐号?