基于Apriori算法图书应用研究.docVIP

下载本文档

14
0
约3.19千字
约 7页
2018-08-27 发布于福建
举报
版权申诉

基于Apriori算法图书应用研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于Apriori算法图书应用研究

基于Apriori算法图书应用研究　　摘要：随着机器学习技术的不断发展，机器学习在社会各个邻域的应用也越来越广泛。在校园图书馆中使用机器学习的方法来实现对学生借阅方面的画像，把握学生阅读规律，精确地向不同的学生推荐其感兴趣的书籍，从而提升学生的学习兴趣就越发显得重要。鉴于此，提出使用机器学习中Apriori模型的方法来分析不同学生的阅读兴趣，并推荐其可能感兴趣的书籍。实验结果表明，所提方法能较准确地分析出学生的借阅兴趣，可作为图书馆书籍推荐分析的有效依据。　　关键词：大数据；机器学习；Apriori；推荐；图书　　中图分类号： TP391 文献标识码：A 文章编号：1009-3044（2018）12-0211-02 　　Abstract： With the development of machine learning technology， it is more and more widely used in every neighborhood of society. It is more and more important to recommend books of interest to different students to promote their interest in learning. Therefore， a method of using Apriori model in machine learning to analyze the reading interest of different students is proposed. The experimental results show that the proposed method can accurately analyze the students interest in borrowing books and can be considerate as an effective basis for library books recommendation analysis. 　　Key words： big data； machine leaning； Apriori； recommend； books 　　学校的图书馆通常藏书众多，书籍种类非常丰富。图书馆藏书的借阅对象也以不同专业的老师和学生居多，这就造成了不同的借阅对象对不同书籍的兴趣差异常常非常明显。这种差异不但出现在不同的学科之间，也出现在不同的年级和年龄段之间。如果再进一步细致分析，还可以发现即使是相同的专业、相似的年级和年龄的不同的借阅对象对书籍的兴趣也可能出现明显的差异。那么如何有效的分析出兴趣迥异的不同的借阅对象的兴趣点，并向该借阅对象推荐其可能感兴趣的某一本书对图书馆就显得很有价值了。　　本文采用某高校学生的图书借阅数据进行分析。该数据记录了学生学号（user_id）和借阅的图书编号（book_id），经过脱敏后数据格式如下所示：　　本文根据学生学号（user_id）和借阅的图书编号（book_id）对该学生的借阅情况进行画像，分析出学生的阅读规律，从而有效地向不同的学生推荐其感兴趣的书籍。分析采用Apriori算法，依据关联规则进行分析。即假如借阅对象A借阅了书籍[1，2，3，4，5]，借阅对象B借阅了书籍[2，3，4，6]，那A和B借阅书籍中有3本是相同的，可以认为A和B兴趣相似，A感兴趣的书籍B也可能感兴趣，因此可以将书籍1和5推荐给借阅对象B；同样，也可以将书籍6推荐给借阅对象A。　　通过这种方式，可以有效根据每一个用户的个性化需求实现为该用户推荐其可能感兴趣的书籍。　　1 模型分析　　1.1 数据预处理　　提出的方法依据借阅对象及其借阅过的书籍进行分析，因此需要所有借阅记录都包括学生学号（user_id）和借阅的图书编号（book_id）。若记录中缺失其中任意一个信息，则该记录就无法反映出一次有效的借阅行为，因此该记录为不可用记录，需要过滤掉，以此保证记录的完整性。此时，数据为具有完整借阅信息的全部记录。　　分析需要统计出每一个借阅对象借阅过的书籍，而此时的数据仅是借阅流水记录，不能反映出同一个借阅对象所借阅过的书籍的共同特性。因此需要将数据按照学生学号（user_id）统计出该学号借阅过的全部书籍。统计后，数据格式转换如下图所示：　　图中，行号表示用户id，列名表示书籍编号。若用户id借阅过该书，则用户id号与书籍对应信息记为T，否则该位置记录为F，表示该用户没有借阅过这本书。通过上图，能清晰地看到一个user_id借阅过的书籍，即该借阅对象对哪些书感兴趣。　　1.2 数据建模　　通过数据