为了账号安全,请及时绑定邮箱和手机立即绑定

如何将混淆矩阵转换为数据帧?

如何将混淆矩阵转换为数据帧?

慕码人2483693 2022-09-13 19:51:56
我想知道如何将混淆矩阵从scikit学习转换为数据帧。我不知道混合不同模型的所有mc是否可行。我为什么问是因为可读性。我必须始终在终端中打印并将mc复制到Excel文件中,这真的很苛刻,因为我根据所选的参数多次运行脚本。models = {'Model_SVC': model1, 'Model_G_NB': model2, 'Model_LR': model3, 'Model_RF': model4,      'Model_KN': model5, 'Model_MLP': model6}        cv_splitter = KFold(n_splits=10, shuffle=False, random_state=None)    for model_name, model in models.items():        y_pred = cross_val_predict(model, features, ylabels, cv=cv_splitter)        print("Model: {}".format(model_name))        print("Accuracy: {}".format(accuracy_score(ylabels, y_pred)))        cm = confusion_matrix(ylabels, y_pred)                output = pd.DataFrame()        print("matrice confusion: {}".format(cm), file=f)矩阵看起来像这样:Model: Model_SVCAccuracy: 0.5692307692307692matrice confusion: [[ 34   4  46] [ 10   2  33] [ 16   3 112]]Model: Model_G_NBAccuracy: 0.43846153846153846matrice confusion: [[31 22 31] [10 13 22] [27 34 70]]Model: Model_LRAccuracy: 0.5461538461538461matrice confusion: [[ 30   4  50] [ 11   0  34] [ 16   3 112]]Model: Model_RFAccuracy: 0.5846153846153846matrice confusion: [[ 40   5  39] [ 17   1  27] [ 20   0 111]]Model: Model_KNAccuracy: 0.4846153846153846matrice confusion: [[33 10 41] [14 12 19] [41  9 81]]Model: Model_MLPAccuracy: 0.5153846153846153matrice confusion: [[ 17   0  67] [ 12   0  33] [ 13   1 117]]我想要这样的东西:   F    C   M0  34   4  461  10   2  332  16   3 112  3  31  22  31   => second cm 4  10  13  225  27  34  706  30   4  50  => third cm7  11   0  348  16   3 112...由于我使用的是“for”,我希望cm相互切换,以便最后我能够将数据导出到一个excel或csv文件中。一个数据框,可以一个接一个地组合所有cm打印。
查看完整描述

2 回答

?
手掌心

TA贡献1942条经验 获得超3个赞

将任何2D矩阵(混淆与否)转换为熊猫数据帧非常简单:


from sklearn.metrics import confusion_matrix

y_true = [2, 0, 2, 2, 0, 1]

y_pred = [0, 0, 2, 2, 0, 2]

cm = confusion_matrix(y_true, y_pred)

print(cm)

# result:

[[2 0 0]

 [0 0 1]

 [1 0 2]]  


import pandas as pd

df = pd.DataFrame(cm)

print(df)

# result:

   0  1  2

0  2  0  0

1  0  0  1

2  1  0  2

full,具有两行和列名称。


合并数据帧也是直截了当的:


cm2 = [[1, 0, 0],

       [0, 0, 1],

       [2, 0, 1]]

df2 = pd.DataFrame(cm2)


cm3 = [[0, 0, 2],

       [1, 2, 1],

       [2, 0, 0]]

df3 = pd.DataFrame(cm3)


frames = [df, df2, df3]


final = pd.concat(frames)

print(final)

# result:

   0  1  2

0  2  0  0

1  0  0  1

2  1  0  2

0  1  0  0

1  0  0  1

2  2  0  1

0  0  0  2

1  1  2  1

2  2  0  0

如果在循环中使用它,则始终可以从空列表开始,用于每个新数据帧,并获取最终帧:frames=[]frames.append(df)pd.concat(frames)


frames = []


for model_name, model in models.items():

        y_pred = cross_val_predict(model, features, ylabels, cv=cv_splitter)

        cm = confusion_matrix(y_true, y_pred)

        df = pd.DataFrame(cm)

        frames.append(df)


final = pd.concat(frames)


查看完整回答
反对 回复 2022-09-13
?
慕尼黑的夜晚无繁华

TA贡献1864条经验 获得超6个赞

存储在列表中,然后使用:np.vstack()


import numpy as np


all_cm = list()

for model_name, model in models.items():

    y_pred = cross_val_predict(model, features, ylabels, cv=cv_splitter)


    print("Model: {}".format(model_name))

    print("Accuracy: {}".format(accuracy_score(ylabels, y_pred)))


    cm = confusion_matrix(ylabels, y_pred)

    all_cm.append(cm)


final_matrix = np.vstack(all_cm)

print(final_matrix)


人工数据示例:


import numpy as np

np.random.seed(0)


all_cm = list()

for i in range(3):

    all_cm.append(np.random.rand(3,3))

final_matrix = np.vstack(all_cm)

print(final_matrix)


[[0.5488135  0.71518937 0.60276338]

 [0.54488318 0.4236548  0.64589411]

 [0.43758721 0.891773   0.96366276]

 [0.38344152 0.79172504 0.52889492]

 [0.56804456 0.92559664 0.07103606]

 [0.0871293  0.0202184  0.83261985]

 [0.77815675 0.87001215 0.97861834]

 [0.79915856 0.46147936 0.78052918]

 [0.11827443 0.63992102 0.14335329]]


查看完整回答
反对 回复 2022-09-13
  • 2 回答
  • 0 关注
  • 200 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号