- 64
- 0
- 约3.19千字
- 约 6页
- 2018-11-27 发布于湖北
- 举报
基于Apriori算法的图书推荐应用研究
摘要:随着机器学习技术的不断发展,机器学习在社会各个邻域的应用也越来越广泛。在校园图书馆中使用机器学习的方法来实现对学生借阅方面的画像,把握学生阅读规律,精确地向不同的学生推荐其感兴趣的书籍,从而提升学生的学习兴趣就越发显得重要。鉴于此,提出使用机器学习中Apriori模型的方法来分析不同学生的阅读兴趣,并推荐其可能感兴趣的书籍。实验结果表明,所提方法能较准确地分析出学生的借阅兴趣,可作为图书馆书籍推荐分析的有效依据。
关键词:大数据;机器学习;Apriori;推荐;图书
中图分类号: TP391 文献标识码:A 文章编号:1009-3044(2018)12-0211-02
Abstract: With the development of machine learning technology, it is more and more widely used in every neighborhood of society. It is more and more important to recommend books of interest to different students to promote their interest in learning. Therefore, a method of using Apriori model in machine learning to analyze the reading interest of different students is proposed. The experimental results show that the proposed method can accurately analyze the students interest in borrowing books and can be considerate as an effective basis for library books recommendation analysis.
Key words: big data; machine leaning; Apriori; recommend; books
学校的图书馆通常藏书众多,书籍种类非常丰富。图书馆藏书的借阅对象也以不同专业的老师和学生居多,这就造成了不同的借阅对象对不同书籍的兴趣差异常常非常明显。这种差异不但出现在不同的学科之间,也出现在不同的年级和年龄段之间。如果再进一步细致分析,还可以发现即使是相同的专业、相似的年级和年龄的不同的借阅对象对书籍的兴趣也可能出现明显的差异。那么如何有效的分析出兴趣迥异的不同的借阅对象的兴趣点,并向该借阅对象推荐其可能感兴趣的某一本书对图书馆就显得很有价值了。
本文采用某高校学生的图书借阅数据进行分析。该数据记录了学生学号(user_id)和借阅的图书编号(book_id),经过脱敏后数据格式如下所示:
本文根据学生学号(user_id)和借阅的图书编号(book_id)对该学生的借阅情况进行画像,分析出学生的阅读规律,从而有效地向不同的学生推荐其感兴趣的书籍。分析采用Apriori算法,依据关联规则进行分析。即假如借阅对象A借阅了书籍[1,2,3,4,5],借阅对象B借阅了书籍[2,3,4,6],那A和B借阅书籍中有3本是相同的,可以认为A和B兴趣相似,A感兴趣的书籍B也可能感兴趣,因此可以将书籍1和5推荐给借阅对象B;同样,也可以将书籍6推荐给借阅对象A。
通过这种方式,可以有效根据每一个用户的个性化需求实现为该用户推荐其可能感兴趣的书籍。
1 模型分析
1.1 数据预处理
提出的方法依据借阅对象及其借阅过的书籍进行分析,因此需要所有借阅记录都包括学生学号(user_id)和借阅的图书编号(book_id)。若记录中缺失其中任意一个信息,则该记录就无法反映出一次有效的借阅行为,因此该记录为不可用记录,需要过滤掉,以此保证记录的完整性。此时,数据为具有完整借阅信息的全部记录。
分析需要统计出每一个借阅对象借阅过的书籍,而此时的数据仅是借阅流水记录,不能反映出同一个借阅对象所借阅过的书籍的共同特性。因此需要将数据按照学生学号(user_id)统计出该学号借阅过的全部书籍。统计后,数据格式转换如下图所示:
图中,行号表示用户id,列名表示书籍编号。若用户id借阅过该书,则用户id号与书籍对应信息记为T,否则该位置记录为F,表示该用户没有借阅过这本书。通过上图,能清晰地看到一个user_id借阅过的书籍,即该借阅对象对哪些书感兴趣。
1.2 数据建模
通
您可能关注的文档
- 基于 “战略―系统”思维的特种设备监管模式及体系研究.doc
- 基于.NET的LINQ to SQL 三层架构的研究与实现.doc
- 基于.NET的高校教学督导信息化服务系统设计与实现.doc
- 基于.NET的网络考试系统的设计与开发.doc
- 基于.NET的农作物育种助手软件的研发.doc
- 基于[SVAR]模型的中国货币政策有效性分析.doc
- 基于“MRC”模型的工会文体活动组织模式柔性化研究.doc
- 福建省龙海市第二中学2017-2018学年高一下学期第二次月考试题(6月)英语word版含答案.docx
- 福建省龙海市第二中学2017-2018学年高一下学期第二次月考试题(6月)语文word版含答案.docx
- 基于“城市触媒理论”的历史片区复兴规划探究.doc
原创力文档

文档评论(0)