- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2014 Mathorcup 数学建模 书籍分类
评委一评分,签名及备注
队号:
20024 评委三评分,签名及备注
评委二评分,签名及备注
选题:
B 评委四评分,签名及备注
题目:网上书店图书推荐 摘要
在如今大数据时代,信息过载已成为购书者与择书之间的主要矛盾。针对这一问题,结合spss,excel,matlab,yaahp等软件,研究用户与书籍、书籍与标签之间的关系,本文构建对购书者进行书籍推荐的模型算法。
本文要求根据给出数据,先需要解决三方面问题。首先,通过user_social.txt,book_tag.txt,user_book_score.txt分析出影响用户对书籍评分的因素,再用excel表格处理已知数据后,从而得到具体的影响数值。然后,根据得出的影响数值推测用户评分的计算公式,再对公式进行检验其正确性,从而计算出评分结果。根据评分公式计算出用户所喜爱类书籍中书籍的分数,依照分数高低进行推荐。
针对问题一,用excel表格对用户的社会关系、书籍与标签关系、用户对书籍评分处理分析得出用户对书籍的评价。从而,假设出影响因素分别是用户所感兴趣的书籍、书籍受欢迎程度、其他用户对该书的评价。用yaahp软件处理用户对书籍的评分与书籍的受欢迎程度、用户的兴趣爱好、及书的综合评分的关系,得出各影响因素的权重,从而证明假设的成立,得到用户对书籍评分的影响因素。
针对问题二,根据问题一中得到的影响因素,用excel表格处理书籍ID与标签的数据、用户ID与关系好友数据和用户ID与用户评分数据三种数据 ,从而得到具体的影响数值。根据得出的影响数值推测用户评分的计算公式,运用user_score.txt中的评分数据检验用户评分公式的正确性。
针对问题三,运用问题二中所建立的模型,在用户所感兴趣的书籍分类中筛选出一部分书籍,综合书籍受欢迎程度、其他用户对该书的评价两项因素,根据公式计算所筛选书籍的分数,将筛选出的书籍的评分最高的三本书书推荐给用户。
关键字:聚类分析法,随机抽样法
网上书店图书推荐
1 问题重述
在大数据时代,信息过载已成读者最重要的问题。针对这一问题我们为网上购买书籍的读者进行书籍推荐。
随着信息技术和互联网的发展,已经是消费者和生产者日益头疼的事情。 推荐,就是解决这一矛盾的重要工具,在互联网的产品及其应用中被广泛采用,包括大家经常使用的相关搜索、话题推荐、电子商务的各种产品推荐、社交网络上的交友推荐等。
我们获得了一个著名网上书店的用户行为信息,包括对于书籍的评分数据,书籍的标签信息以及用户的社交关系,根据数据完成以下问题。
1.1问题一
分析影响用户对书籍评分的因素;
1.2问题二
建立一个模型,预测predict.txt附件中的用户对未看过书籍的评分;
1.3问题三
针对predict.txt附件中的用户,给每个用户推荐3本没看过的书籍。
2 问题分析
随着信息技术和互联网的不断发展,信息过剩已成为生产者和消费者的主要矛盾。然而,推荐是可以解决这种问题的优良工具,在互联网的产品和消费中被广泛应用。但是,在使用过程中还需要不断的优化。
对于问题一,本文通过book_tag.txt中的已知数据书籍ID和标签,进行标签数量统计和处理,最终得到了一份准确的书籍和书籍受欢迎程度的关系图,得出影响用户对书籍评价的影响因素,建立影响因素和评分的层次分析法模型,并且运用yaahp软件判断影响因素和评分的一致性,得到各影响因素的权值。
对于问题二,根据模型一已经确定的影响因素,用excel表格对user_ social.txt分析处理用户ID和关系好友ID数据,得到用户的好友数量与其兴趣爱好准确数值关系,用excel表格对book_tag.txt分析处理书籍ID和标签这两个数据,得到书籍的受欢迎程度与书籍的标签个数的准确数值关系,用excel表格对user_book_score.txt处理score数据,用户对该书籍的评价,总结出了用户在这些因素下评价所占的比例,得到用户对未看过书籍的评分关系式,需要用户对未看过书籍的预测评价较多,根据分析和处理出的评价因素,在Matlab中依据确定的用户ID和书籍ID建立预测用户评分模型。最终,计算出用户对未书籍的评分。
对于问题三,运用聚类分析法对书籍及用户的兴趣爱好进行分类,以确定用户兴趣所属类别。根据问题二所建立的模型,考虑三种因素,对书籍进行评分,因素一,分数较高的书籍;因素二,书籍所属类别是否是用户所喜爱书籍的类别;因素三,书籍的受欢迎程度。根据这三个因素确定比重,运用加权的思想来对书籍进行最终评分,选择评分高的三本书籍推荐给用户。
模型的假设
假设这一网站的数据具有一定的可信度。
2.假设在大量具有相同标签的用户中,无论随机选取那几个进行分析,筛选,研究
您可能关注的文档
- 2013赫茨伯格双因素理论.ppt
- 2014 司法考试卷二.doc
- 2014 第一讲 刑法基础论.ppt
- 2014 第三讲 排除犯罪的事由.ppt
- 2014 第五讲 共同犯罪.ppt
- 2014 第八讲 刑罚论.ppt
- 2014 第六讲 罪数形态.ppt
- 2014 财经法规必须要看的补充材料.doc
- 2014-2015 兖州区第一学期期末试卷.doc
- 2014-2015《形势与政策》第七专题 深化科技创新,推动创新驱动发展战略.doc
- 2014-2015八年级语文下册期末考试卷.doc
- 2014-2015东城区高二上英语期末测试题.doc
- 2014-2015学年上学期第一课__享受语文.ppt
- 2014-2015学年广东省潮州市高二(下)期末物理试卷 (解析版).doc
- 2014-2015学年度宁夏银川一中高二下学期期末考试生物doc.doc
- 2014-2015学年第一学期民诉5.ppt
- 2014-2015学年度人教版九年级上第二次月考数学试卷及答案.doc
文档评论(0)