-
模型评估。
查看全部 -
jupyter主题安装
查看全部 -
CSV 下载地址:https://github.com/weiwanling/TensorFlow_Experiment/tree/1241a064d780cdcf278e4f8edec0f7bbd9bc0aea
查看全部 -
# True Positives(TP):预测准确、实际为正样本的数量(实际为1,预测为1) # True Negatives(TN):预测准确、实际为负样本的数量(实际为0,预测为0) # False Positives(FP):预则错误、实际为负样本的数量(实际为0,预测为1) # False Negatives(FN):预测错误、实际为正样本的数量(实际为1,预测为0) # 准确率 (TP+TN)/(TP+TN+FP+FN) 整体样本中,预测正确的比例 # 错误率 (FP+FN)/(TP+TN+FP+FN) 整体样本中,预测错误的比例 # 召回率 TP/(TP+FN) 正样本中,预测正确的比例 # 特异度 TN/(TN+FP) 负样本中,预测正确的比例 # 精确率 TP/(TP+FP) 预测结果为正样本中,预测正确的比例 # F1分数 2*精确率*召回率/(精确率+召回率) 综合精确率和召回率的指标
查看全部 -
# 泥淆矩阵,又称为误差矩阵,用于衡量分类算法的准确程度 # --------------------预测结果--------------------------------- # 0 1 # 实际 0 True Negatives(TN) False Positives(FP) # 结果 1 False Negatives(FN) True Positives(TP) # ------------------------------------------------------------ # True Positives(TP):预测准确、实际为正样本的数量(实际为1,预测为1) # True Negatives(TN):预测准确、实际为负样本的数量(实际为0,预测为0) # False Positives(FP):预则错误、实际为负样本的数量(实际为0,预测为1) # False Negatives(FN):预测错误、实际为正样本的数量(实际为1,预测为0)
查看全部 -
通过多个角度看模型评估的好坏
查看全部 -
逻辑回归:计算概率判断类别,应用场景 二分类问题
准确率预测的局限性:准确度存在空准确率的问题(直接丢掉了负样本,只关注正样本)、没有体现实际分布情况、没有体现模型错误预测类型
混淆矩阵:又称为误差矩阵,衡量分类算法的准确程度,含6个指标
查看全部 -
用所有的数据进行训练可能会适得其反,不仅模型复杂化,且准确度不一定更高
评估思想:将训练数据和测试数据分离
判断模型的准确率:比较预测结果和实际结果,正解的比例占到多少
from sklearn.metrics import accuracy_scoreprint(accuracy_score(y,y_pred))
查看全部 -
分类问题场景:垃圾邮件、三类或两类以下的品种的分类
分类算法:K近邻、逻辑回归、决策树、朴素贝叶斯
调用KNN模型:from sklearn.neighbors import KNeighborsclassifier
创建一个KNN模型实例knn = KNeighborsClassifier(n_neighbors=1)
模型训练(学习):knn.fit(X,y)
模型预测:knn.predict([[1,2,3,4]])
)
查看全部 -
为什么不能自动保存。。。。
查看全部 -
scikit-learn 是python 专门针对机器学习的开源框架
jupyter notebook 是基于web的应用程序,可视化强,可单独测试某个代码块
查看全部 -
监督式学习:有固定结果
非监督式学习:无固定结果
查看全部 -
绘制图表,进行数据可视化
pandas:基础数据分析套件
scikit-learn:强大的数据分析建模库
keras:人工神经网络
查看全部 -
监督式学习
非监督式学习
强化学习
查看全部 -
python安装
3.7.4最新版本
anaconda
Anaconda Distribution
查看全部
举报