- 7
- 0
- 约1.67万字
- 约 21页
- 2017-02-08 发布于重庆
- 举报
2014Mathorcup数学建模书籍分类
评委一评分,签名及备注
队号:
20024 评委三评分,签名及备注
评委二评分,签名及备注
选题:
B 评委四评分,签名及备注
题目:网上书店图书推荐 摘要
在如今大数据时代,信息过载已成为购书者与择书之间的主要矛盾。针对这一问题,结合spss,excel,matlab,yaahp等软件,研究用户与书籍、书籍与标签之间的关系,本文构建对购书者进行书籍推荐的模型算法。
本文要求根据给出数据,先需要解决三方面问题。首先,通过user_social.txt,book_tag.txt,user_book_score.txt分析出影响用户对书籍评分的因素,再用excel表格处理已知数据后,从而得到具体的影响数值。然后,根据得出的影响数值推测用户评分的计算公式,再对公式进行检验其正确性,从而计算出评分结果。根据评分公式计算出用户所喜爱类书籍中书籍的分数,依照分数高低进行推荐。
针对问题一,用excel表格对用户的社会关系、书籍与标签关系、用户对书籍评分处理分析得出用户对书籍的评价。从而,假设出影响因素分别是用户所感兴趣的书籍、书籍受欢迎程度、其他用户对该书的评价。用yaahp软件处理用户对书籍的评分与书籍的受欢迎程度、用户的兴趣爱好、及书的综合评分的关系,得出各影响因素的权重,从而证明假设的成立,得到用户对书籍评分的影响因素。
针对问题二,根据问题一中得到的影响因素,用excel表格处理书籍ID与标签的数据、用户ID与关系好友数据和用户ID与用户评分数据三种数据 ,从而得到具体的影响数值。根据得出的影响数值推测用户评分的计算公式,运用user_score.txt中的评分数据检验用户评分公式的正确性。
针对问题三,运用问题二中所建立的模型,在用户所感兴趣的书籍分类中筛选出一部分书籍,综合书籍受欢迎程度、其他用户对该书的评价两项因素,根据公式计算所筛选书籍的分数,将筛选出的书籍的评分最高的三本书书推荐给用户。
关键字:聚类分析法,随机抽样法
网上书店图书推荐
1 问题重述
在大数据时代,信息过载已成读者最重要的问题。针对这一问题我们为网上购买书籍的读者进行书籍推荐。
随着信息技术和互联网的发展,已经是消费者和生产者日益头疼的事情。 推荐,就是解决这一矛盾的重要工具,在互联网的产品及其应用中被广泛采用,包括大家经常使用的相关搜索、话题推荐、电子商务的各种产品推荐、社交网络上的交友推荐等。
我们获得了一个著名网上书店的用户行为信息,包括对于书籍的评分数据,书籍的标签信息以及用户的社交关系,根据数据完成以下问题。
1.1问题一
分析影响用户对书籍评分的因素;
1.2问题二
建立一个模型,预测predict.txt附件中的用户对未看过书籍的评分;
1.3问题三
针对predict.txt附件中的用户,给每个用户推荐3本没看过的书籍。
2 问题分析
随着信息技术和互联网的不断发展,信息过剩已成为生产者和消费者的主要矛盾。然而,推荐是可以解决这种问题的优良工具,在互联网的产品和消费中被广泛应用。但是,在使用过程中还需要不断的优化。
对于问题一,本文通过book_tag.txt中的已知数据书籍ID和标签,进行标签数量统计和处理,最终得到了一份准确的书籍和书籍受欢迎程度的关系图,得出影响用户对书籍评价的影响因素,建立影响因素和评分的层次分析法模型,并且运用yaahp软件判断影响因素和评分的一致性,得到各影响因素的权值。
对于问题二,根据模型一已经确定的影响因素,用excel表格对user_ social.txt分析处理用户ID和关系好友ID数据,得到用户的好友数量与其兴趣爱好准确数值关系,用excel表格对book_tag.txt分析处理书籍ID和标签这两个数据,得到书籍的受欢迎程度与书籍的标签个数的准确数值关系,用excel表格对user_book_score.txt处理score数据,用户对该书籍的评价,总结出了用户在这些因素下评价所占的比例,得到用户对未看过书籍的评分关系式,需要用户对未看过书籍的预测评价较多,根据分析和处理出的评价因素,在Matlab中依据确定的用户ID和书籍ID建立预测用户评分模型。最终,计算出用户对未书籍的评分。
对于问题三,运用聚类分析法对书籍及用户的兴趣爱好进行分类,以确定用户兴趣所属类别。根据问题二所建立的模型,考虑三种因素,对书籍进行评分,因素一,分数较高的书籍;因素二,书籍所属类别是否是用户所喜爱书籍的类别;因素三,书籍的受欢迎程度。根据这三个因素确定比重,运用加权的思想来对书籍进行最终评分,选择评分高的三本书籍推荐给用户。
模型的假设
假设这一网站的数据具有一定的可信度。
2.假设在大量具有相同标签的用户中,无论随机选取那几个进行分析,筛选,研究
您可能关注的文档
- 11《邓稼先》导学案附答案.doc
- 11田园诗情.doc
- 11长度和时间的测量.doc
- 11生物的特征.doc
- 12岁以前的语文.doc
- 12教案.doc
- 12关于世界观的学说教案.doc
- 12主要自然灾害的形成与分布.doc
- 13-14公共教育学期中考试题A卷.doc
- 13-18册美术基础知识(汇总版).doc
- 2026年哈密职业技术学院单招职业技能考试题库及1套参考答案详解.docx
- 2026年哈尔滨幼儿师范高等专科学校单招职业技能考试题库带答案详解(实用).docx
- 2026年吉林工业职业技术学院单招职业技能考试题库附答案详解(培优).docx
- 2026年《党章知识测试题完整答案.docx
- 2026年合肥滨湖职业技术学院单招职业技能考试题库带答案详解(突破训练).docx
- 2026年合肥经济技术职业学院单招职业技能考试题库附参考答案详解(突破训练).docx
- 2026年合肥科技职业学院单招职业技能考试题库含答案详解(培优b卷).docx
- 2026年吉林城市职业技术学院单招职业技能考试题库含答案详解(综合题).docx
- 《JBT 6844-2015金属管浮子流量计》专题研究报告.pptx
- 《JBT 7225-2017 暖风机》专题研究报告:标准解析与行业前瞻.pptx
最近下载
- 《GB/T 38271-2025塑料 聚苯乙烯(PS)、抗冲击聚苯乙烯(PS-I)、丙烯腈-丁二烯-苯乙烯(ABS)及苯乙烯-丙烯腈(SAN)树脂中残留苯乙烯单体含量的测定 气相色谱法》.pdf
- 刑事诉讼法(西南政大)中国大学MOOC 慕课 期末考试答案.docx VIP
- (正式版)H-J 1079-2019 固定污染源废气 氯苯类化合物的测定 气相色谱法(正式版)(正式版).docx VIP
- 一种多酶级联反应催化蔗糖生产异麦芽酮糖醇的方法及其应用.pdf VIP
- 美国膳食指南(2025-2030)解读课件PPT.pptx
- 2025版护理文书书写规范PPT课件(完整版).pptx
- 2025年组织生活会个人对照检查发言材料.docx VIP
- 心功能不全护理查房.pptx VIP
- 2025年房地产经纪人房产议价经典案例分析之“法律纠纷预防”专题试卷及解析.pdf VIP
- 2025年无人机驾驶员执照自动驾驶模式数据链通信原理专题试卷及解析.pdf VIP
原创力文档

文档评论(0)