- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CN107392644-CN201710464566-一种商品购买预测建模方法
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 107392644 A
(43)申请公布日
2017.11.24
(21)申请号 201710464566.3
(22)申请日 2017.06.19
(71)申请人 华南理工大学
地址 510640 广东省广州市天河区五山路
381号
(72)发明人 李拥军 邱双旭 林浩
(74)专利代理机构 广州市华学知识产权代理有
限公司 44245
代理人 许菲菲
(51)Int.Cl.
G06Q 30/02(2012.01)
G06N 99/00(2010.01)
权利要求书1页 说明书5页
(54)发明名称
一种商品购买预测建模方法
(57)摘要
本发明公开了一种商品购买预测建模方法。
该方法包括用购买记录标记训练样本,预测购买
与否;滑动窗口商品购买样本构造;基于时间偏
好的商品购买特征设计;梯度提升决策树算法训
练预测;构造好样本与特征之后,要进行特征处
理与选取的工作,再输入到梯度提升决策树算法
中进行训练预测;特征选取的指标包括特征值分
布与相关性、特征信息增益大小、特征调用频率、
特征敲除的影响等。综合这些指标对特征重要性
进行排序,剔除重要度低的冗余特征。本发明提
出滑动窗口样本构造方法和基于时间偏好的特
征体系,有效提升商品购买预测模型的准确性,
A 用于解决大数据背景下商品个性化推荐问题,为
4 用户在合适的时间、合适的地点精准推荐合适的
4
6
2 商品。
9
3
7
0
1
N
C
CN 107392644 A 权 利 要 求 书 1/1页
1.一种商品购买预测建模方法,其特征体在于包括如下步骤:
1)用购买记录标记训练样本,预测购买与否,结果为1代表购买,为0则代表不购买;
2)滑动窗口商品购买样本构造;
3)基于时间偏好的商品购买特征设计;遵循时间偏好规则:近期频繁做某件事情,就越
有可能在下次继续;通过User‐Item特征、User特征、Item特征、Category特征、User‐
Category特征和Cross特征6大类特征描述用户对商品的购买行为;在6大类特征的基础上,
从8个维度进行特征的提取;所述8个维度分别是计数、比值、Flag、排序、时间间隔、时间层
级、规则和地理位置;
4)梯度提升决策树算法训练预测;构造好样本与特征之后,要进行特征处理与选取的
工作,再输入到梯度提升决策树算法中进行训练预测;特征选取的指标包括特征值分布与
相关性、特征信息增益大小、特征调用频率、特征敲除的影响;综合这些指标对特征重要性
进行排序,剔除重要度低的冗余特征。
2.根据权利要求1所述的商品购买预测建模方法,其特征体在于,所述用购买记录标记
训练样本采用交叉验证法将数据样本切割成较小子集,分别在不同的子集上做训练与验
证,进行优化。
3.根据权利要求1所述的商品购买预测建模方法,其特征体在于,所述滑动窗口商品购
买样本构造是将时间轴分成两个部分,一部分刻画用户的历史行为,另一部分刻画类别标
签,往时间节点前面滑动,充分利用历史信息,产生不同时间节点样本输入到模型,使模型
鲁棒性更好。
4.根据权利要求1所述的商品购买预测建模方法,其特征体在于,所述User-Item特征
为用户-商品特征,描述用户对商品的行为,主要刻画用户对商品的喜好程度;所述User特
征为用户特征,描述用户自身属性,主要刻画用户的活跃度、购买力;所述Item特征为商品
特征,描述商品自身属性,主要刻画商品的销量、受欢迎程度;所述Catego
您可能关注的文档
- CN107413214-CN201710425650-基于四元泵系统的缓冲液配置系统.pdf
- CN107413183-CN201610348971-一种有机废气回收处理工艺与成套装置.pdf
- CN107413173-CN201610348973-一种高效有机废气回收处理方法与成套装置.pdf
- CN107413165-CN201610348974-一种油吸收结合双膜循环的有机废气处理工艺与装置.pdf
- CN107413164-CN201610347509-一种二级膜循环回收处理有机废气的工艺与装置.pdf
- CN107412833-CN201710176491-汽化过氧化氢空间灭菌方法.pdf
- CN107412779-CN201710243029-一种具有物理靶向性的抗肿瘤药物载体的制备方法.pdf
- CN107412419-CN201710798499-一种复方益肝灵片的制备方法.pdf
- CN107412380-CN201710875700-一种有效抗肿瘤中药散剂及其制备方法和应用.pdf
- CN107412355-CN201710282312-一种大黄中药饮片的炮制方法.pdf
- CN107392642-CN201710446922-一种基于假设检验与01整数规划的商品选择方法.pdf
- CN107392556-CN201710830612-基于三角犹豫模糊数应急物资储备库选址多属性决策方法.pdf
- CN107392509-CN201710789140-一种基于物元分析的河道生态径流过程评价方法.pdf
- CN107392508-CN201710778056-电网中坚层结构与经济发展对应关系的评价方法及系统.pdf
- CN107392486-CN201710635377-一种高效率的数据分析及挖掘算法.pdf
- CN107392482-CN201710631942-一种评价准确的人行道服务水平评价系统.pdf
- CN107392477-CN201710624069-一种海洋波浪能风能资源联合区域等级划分方法.pdf
- CN107392475-CN201710620549-一种属性强度函数已知的煤炭资源采矿权估价方法.pdf
- CN107392471-CN201710606364-一种基于大数据的城市公共安全防控方法、装置与系统.pdf
- CN107392466-CN201710601289-一种电网电能质量动态综合评价方法及装置.pdf
文档评论(0)