- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浙江工商大学计算机与信息工程学院
《Python 程序设计与实践》大作业报告
专 业 : 计 科 班 级 : 1404
学 号:1412190416、1412190415、1412190413
姓 名: 陆阳,孙勇,裘昇明 指 导 教 师 : 蒲 飞
2015 年 6 月 28 日 ;
题目介绍:
在真实的业务场景下,我们往往需要对所有商品的一个子集构建个性化推荐 模型。在完成这件任务的过程中,我们不仅需要利用用户在这个商品子集上的行 为数据,往往还需要利用更丰富的用户行为数据。定义如下的符号:
U——用户集合 I——商品全集
P——商品子集,P ? I
D——用户对商品全集的行为数据集合
那么我们的目标是利用D 来构造 U 中用户对 P 中商品的推荐模型。
数据说明:
竞赛数据包含两个部分。第一部分是用户在商品全集上的移动端行为数据(D), 表名为tianchi_mobile_recommend_train_user,包含如下字段:
;3; ;5;6; entry_time=datetime.strptime(str_time,%Y-%m-%d %H)
datatime_delta=(entry_time-begin_time).days
return int(datatime_delta)
df_train_user=pd.read_csv(tianchi_mobile_recommend_train_user.csv)
print ========================================\n
print 时间转换进行中 ...\n
df_train_user.time=df_train_user.time.map(lambda x:trans_time(x))
df_train_user.to_csv(train_trans_time.csv,index=False) t1=time.time()
print 时间转换结束!\n
print 转换时间共耗时%f 秒 %(t1-t0)
⑵ 划分训练集和测试集
在分类问题中,模型需要经过训练集的学习,才能用于测试集,而训练集和 测试集在形式上的区别在于前者有类别标签,后者则需要模型输出相应的类别标 签。这里的问题是依据 31 天的用户操作记录预测第 32 天的购买情况,所以通常
来说,训练集的构建需要利用 31 天的数据,而其相应的类别标签如何标注在训
练集中?这个与你如何划分训练集和测试集有关;而测试集的构建则可用到 31
天的完整数据。下面举个例子,用于解释训练集和测试集的具体表现形式。 ; ;9;10;11;12;13;定义数据集的每个用户对商品全集中的商品加入购物车行为的总数为购物 车量。这里可以从加入购物车行为直接推断用户对某商品感兴趣,虽然购物车 量必定大幅度小于点击量??收藏量,但是加入购物车行为反映用户对某个商品 感兴趣程度必定大于点击和收藏行为反映的感兴趣程度。
5. 购买量
定义数据集的每个用户对商品全集中商品的购买行为的总数为购买量,或 者说用户购买商品子集的商品数量为购买量。这里可以从用户的购买行为直接
推断为用户对某商品感兴趣,对个性化推荐有重要的意义。
为了更清楚地看到购买量与点击量、收藏量、加购物车量的关系,对用户前 10 天的行为数据用散点图表示,以用户前 10 天的购买量为横坐标,其他三类行 为是纵坐标,如图,可以看出用户点击量与其他的行为量相比明显大很多,而点 击量越多的用户购买量就越少。;15;16;17;18;19;20;21;22;23;24;25;26;27;28;29
您可能关注的文档
- PE400×600复摆颚式破碎机结构设计.pptx
- PEP三年级上Unit 3 Let’s Paint A Let’s learn教学设计.pptx
- pep三年级下册英语第六单元知识点.pptx
- PEP五年级上册小学英语试卷.pptx
- pep五年级下学期连词成句.pptx
- PEP人教版三年级下册英语期中试卷.pptx
- PEP人教版小学五年级英语下册期末试卷及答案.pptx
- pep六年级下册英语教学计划.pptx
- pep小学三年级下册英语期末测试题.pptx
- PEP小学三年级下册英语课文及翻译.pptx
- 主题课程整理大班上.doc
- 2026人教版小学语文三年级上册期末综合试卷3套(打印版含答案解析).docx
- 2026人教版小学语文四年级下册期末综合试卷3套(打印版含答案解析).docx
- 2026人教版小学二年级上册数学期末综合试卷精选3套(含答案解析).docx
- 2026人教版小学语文四年级上册期末综合试卷3套(含答案解析).docx
- 2026人教版小学二年级下册数学期末综合试卷3套(打印版含答案解析).docx
- 2026年地理信息行业年终总结汇报PPT.pptx
- 板块四第二十一单元封建时代的欧洲和亚洲 中考历史一轮复习.pptx
- 中考历史一轮复习:板块四第二十单元古代亚、非、欧文明+课件.pptx
- 第二次工业革命和近代科学文化中考历史一轮复习.pptx
原创力文档


文档评论(0)