为了账号安全,请及时绑定邮箱和手机立即绑定

如何从大数据中找出两条相同的信息

如何从大数据中找出两条相同的信息

守候你守候我 2019-03-29 11:00:14
有50亿条商品名称信息,每条信息最长是50个字符,给定限制内存是4G,如何从这50亿条商品信息中查找出任意两条相同商品名称信息。给出思路以及算法思路。
查看完整描述

2 回答

?
冉冉说

TA贡献1877条经验 获得超1个赞

把商品名称分词,再对分词进行向量运算。然后就把这个问题转换成了向量比较问题,夹角越小则越被认为是同一个商品。
                            
查看完整回答
反对 回复 2019-03-29
  • 2 回答
  • 0 关注
  • 447 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号