为了账号安全,请及时绑定邮箱和手机立即绑定

如何评估用于降维的自动编码器

如何评估用于降维的自动编码器

婷婷同学_ 2023-06-20 17:16:33
我使用自动编码器作为降维技术,将学习到的表示用作可用于进一步分析的低维特征。代码片段:# Note: implementation --> based on keras encoding_dim = 32# Define input layerX_input = Input(shape=(X_train.shape[1],))# Define encoder:encoded = Dense(encoding_dim, activation='relu')(X_input)# Define decoder:decoded = Dense(X_train.shape[1], activation='sigmoid')(encoded)# Create the autoencoder modelAE_model = Model(X_input, decoded)#Compile the autoencoder modelAE_model.compile(optimizer='adam', loss='mse')#Extract learned representationlearned_feature = Model(X_input, encoded)history = AE_model.fit(X_train, X_train, epochs=10, batch_size=32)我一直在寻找一种方法来衡量学习表示的质量。我发现一种方法是测量重建误差。我使用以下代码来这样做:import mathreconstr_error = AE_model.evaluate(X_train, X_train, verbose=0)print('The reconstruction error: %.2f MSE (%.2f RMSE)' % (reconstr_error , math.sqrt(reconstr_error )))结果我得到了 0.00 MSE (0.05 RMSE)。然而,我不确定上面的代码在测量重构误差方面是否正确?另外,如果有其他方法可以这样做,请告诉我。
查看完整描述

1 回答

?
慕丝7291255

TA贡献1859条经验 获得超6个赞

您出于什么目的进行压缩?如果您的项目中有以下分类器模型,您可以使用正常(未输入 AE)数据训练该模型并查看准确性或您正在测量的任何内容。然后训练相同的模型,但在使用 AE 压缩数据之后。那么如果你也得到了比较好的结果,这意味着你正在提取一些对自动编码器有用的东西。特别是如果您不使用所有数据来训练 AE 并查看 AE 在其训练中未看到的示例的压缩将如何影响准确性。

在 PCA 等其他技术中,主成分是特征向量,这些特征向量对应的特征值实际上非常有意义,它们告诉你数据中有多少信息在每个方向上变化,就像方差一样。但在 AE 中,尤其是 Deep 中,这种分析并不直观,或者至少超出我的知识范围(如果存在的话)。但是在 1 层 AE 中也许你仍然可以做一些类似的事情,实际上,以 MSE 为目标的 1 层 AE 非常接近 PCA。您可以在隐藏层中提取这些权重,也可以在数据协方差矩阵上应用 PCA 或特征分解。然后计算那些隐藏层权重和特征向量之间的余弦距离,看看它是否保留了一些有意义的东西。

我不知道是否可以做更多的事情,但如果这对您很重要,也许您可以找到一些论文来解决这些问题。


查看完整回答
反对 回复 2023-06-20
  • 1 回答
  • 0 关注
  • 102 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信