为了账号安全,请及时绑定邮箱和手机立即绑定

关于手机等品牌型号搜索与采集的中文分词分离

标签:
资讯

很久以前,写过一个手机的搜索查询,这里要涉及到手机类型和型号的分离。

很久之后前,有人问起这个问题,于是,写点说明就把这函数的草稿发布了,并写下了这一些说明。

函数说明,如搜索输入:诺基亚N95,将被拆分成品牌:诺基亚 型号:N95

对于手机数据采集,也可以用这函数分离出品牌和型号。

SetSearchKey("诺基亚N95",out 诺基亚,out N95);

 

函数代码如下:

 

复制代码

protected void SetSearchKey(string keyword, out string goodsName, out string goodsModel)
        {
            keyword = keyword.ToLower().Trim();
            if (keyword.Contains(" "))//带空格,分离
            {
                goodsName = keyword.Split(' ')[0].Trim();
                goodsModel = keyword.Split(' ')[1].Trim();
            }
            else if (Regex.Match(keyword, @"^[\u4E00-\u9FA5]+[\w\d]+").Success)//以中文开头,包含英文,分离
            {
                goodsName = Regex.Match(keyword, @"^([\u4E00-\u9FA5]+)[\w\d]+").Groups[1].Value;
                goodsModel = keyword.Replace(goodsName, string.Empty);
            }
            else
            {
                string[] keys = new string[] { "nec", "lg", "vk", "cect" };
                for (int i = 0; i < keys.Length; i++)
                {
                    if (keyword.IndexOf(keys[i]) == 0)
                    {
                        goodsName = keys[i];
                        goodsModel = goodsModel = keyword.Replace(goodsName, string.Empty);
                        return;
                    }
                }
                goodsName = keyword;
                goodsModel = keyword;

            }
        }
复制代码

 

 

点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

举报

0/150
提交
取消