-
Python安装:https://www.python.org/downloads/release/python-374/
Anaconda安装:https://www.anaconda.com/products/individual/download-success
conda install scikit-learn
4.界面优化:https://github.com/dunovank/jupyter-themes
jt -t oceans16 -f fira -fs 17 -cellw 90% -ofs 14 -dfs 14 -T
查看全部 -
皮马印第安人糖尿病数据:https://www.kaggle.com/uciml/pima-indians-diabetes-database
本地下载:https://nico.cc/softs/pima-indians-diabetes-database.zip
查看全部 -
数据分离:
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X,y,test_size = 0.4)
定义一个k的范围:k_range = list(range(1,26))
定义变量存储多个数据:score_train = []
将单个数据存储在范围变量中:score_train.append(accuracy_score(y_train, y_train_pred))
定义一个循环:for k in k_range:
以线的形式绘制一个对比图:
import matplotlib.pyplot as plt
%matplotlib inline
plt.plot(k_range,score_test)
plt.xlabel('K(Knn model)')
plt.ylabel('test_accuracy')
当k=1的时候,模型是最复杂的
查看全部 -
加载数据集:from sklearn import datasets
加载数据集中的iris:iris = datasets.load_iris()
查看全部 -
界面设置
jt -t oceans16 -f fira -fs 17 -cellw 90% -ofs 14 -dfs 14 -T
查看全部 -
import pandas as pd
path = 'data/pima-indians-diabetes.csv'
pima=pd.read_csv(path)
pima.head()
#X,y赋值
feature_name=['pregnant','insulin','bmi';age']
X = pima[feature_names]
y =pima.label
#确认维度
print(X.shape)
print(y.shape)
#数据分离
from sklearn.model_selection import train_test_split
X_trian,X_test,y_train,y_test = train_test_split(X,y,random_state=0)
#模型训练
from sklearn.linear_model import logisticregression
logReg = logisticRegression()
logReg.fit(X_train,y_train)
y_pred = logReg.predict(X_test)
from sklearn import metric
print("metrics.accuracy_score(y_test,y_pred)
##确认正负样本的数据量以及空准确率
y_test.value_counts()
y_test.mean()
1-y_test.mean()
max(y_test.mean(),1-y_test.mean())
#展示部分书记结果与预测结果
print(y_test.value[0:25]
pritn(y_pred[0:25]
#计算并展示混淆矩阵
confusion = metrics.confusion_metrix(y_test,y_pred)
#四个因子赋值
TN = confusion[0][0]
FP = confusion[0][1]
FN = confusion[1][0]
TP = confusion[1][1]
#指标计算
accuracy = (TP+TN)/(TP+TN+FP+FN)
mis_rate =(FP+FN)/(TP+TN+FP+FN)
recall =TP/(TP+FN)
specificity =TN(TN+FP)
precision = TP/(TP+FP)
f1_score = 2*precison*recall/(precision+recall)
查看全部 -
混淆矩阵的应用举例
查看全部 -
混淆矩阵的指标
查看全部 -
混淆矩阵的定义
查看全部 -
scikit-learn 集成了相对成熟的算法,相关文档和资料也比较丰富
查看全部 -
讲解很耐心,很清晰,一步步开始到结束。期待老师的下个课程查看全部
-
巍峨问问我的查看全部
-
这是我的笔记2查看全部
-
测试记笔记查看全部
-
了解
查看全部
举报