为了账号安全,请及时绑定邮箱和手机立即绑定

计算两对 X 和 y 之间相似度的最佳实践是什么

计算两对 X 和 y 之间相似度的最佳实践是什么

守着一只汪 2022-07-26 09:40:26
我对一个元素有一些价值观。例如,element1: values1, values2。对于每个元素,我需要计算给定数量的特征的“分数”。想象一下,我们有一个特征表示为:特征 1 的高分由 value1 的高分和 value2 的低分给出。因此,如果我假设 value1 (1) 的高分和 value2 (0) 的低分对应于“feature1”的高分,那么计算 feature1 的得分的最佳实践是 value1 和 value2 两个不同分数?(例如 value1=0.7,value=0.2)。我使用 Python 作为编程语言,并且我更喜欢使用 sklearn 广告模块,但所有适合的解决方案都被接受。
查看完整描述

1 回答

?
慕斯709654

TA贡献1840条经验 获得超5个赞

  1. 首先标准化您的数据。一种规范化是使您的 values1、values2 适合范围 [0,1]。

  2. 假设基于归一化数据的特征 1 的平均 2 值表征为 (.7, .2)。对于任何新的 2 值 (x,y),计算 (x,y) 和 (.7,.2) 之间的距离

在机器学习中计算距离时,通常不计算 sqrt 分量。

dist^2 = (x-.7)^2 + (y-.2)^2

您可能还对计算 2 值 (x,y) 与 (.7,.2) 的误差感兴趣,并且可以查看分类交叉熵。


查看完整回答
反对 回复 2022-07-26
  • 1 回答
  • 0 关注
  • 76 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号