直接使用三级品类,在电商平台进行搜索查询,获取搜索结果页的商品数据,自动归类到对应的品类下方
???待需试验确定的问题
(1)部分电商会识别出搜索关键词在不同品类中,如搜索“男装”会出现服饰品类、图书音像品类等,目前暂定分类属性默认第一项
(2)电商搜索结果智能匹配程度高,搜索结果会存在相关程度不高的商品,但此类结果电商都会将展示权重调后,因此届时需要再确定每个品类在每个电商平台的爬取页码范围
确定商品爬取字段,详见《商品爬取字段表》
App对字段数据的处理展示
识别规则:
(1)优先按品类筛选
(2)品牌是否一致
(3)商品描述(商品标题)的文本相似度
???待研究的问题
(1)需要分词相关技术预研,涉及词语划分、词性权重、语义识别等相关技术;
(2)需要电商行业词库,用于识别语义,已确定词语对应的意思,这方面词库需要采购,目前暂未发现有效的采购来源