- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE
PAGE 1
基于模糊聚类的数字图书馆个性化推荐系统方案设计
摘要:用户建模是数字图书馆个性化推荐系统中的关键技术,本文依据中图法对用户兴趣进行了建模,并通过Apriori关联规则算法挖掘了信息资源各类别间的关联,然后通过FCM算法对用户进行聚类分析得到目标用户的最近邻,在Top_n最近邻居集中通过协调过滤技术产生推荐。实验结果表明,本文提出的方案是可行的和有效的,也为创新数字图书馆个性化服务提供了一种新的思路。
Abstract:Usermodelingisakeytechnologyofpersonalizedrecommendationsystem.AccordingtotheChineselibraryclassification,weestablishedtheuserinterestmodel,andminedthelinkoftheinformationresourcesthroughtheApriorialgorithm.Thenwegetthetargetuser’snearestneighborbyclusteringanalysistotheuserthroughFCMalgorithmandproducerecommendthroughthecollaborativefilteringinthetop_nnearestneighborconcentration.Experimentalresultsshowthattheproposedschemeisfeasibleandeffective,andalsoprovideanewwayfortheinnovationofdigitallibrarypersonalizedservice.
关键词:数字图书馆;推荐系统;模糊聚类;协同过滤
Keywords:DigitalLibrary;recommendedsystem;FuzzyClustering;CollaborartiveFiltering
中图分类号:TP39文献标识码:A文章编号:1006-4311(2013)06-0174-03
0引言
数字图书馆个性化推荐系统通过有效利用不同层次、不同类别的数据资源,以满足不同用户的个性化需求,已成为当前提高数字图书馆的服务质量、效率和信息资源利用水平的一种重要工具。如康奈尔大学图书馆的MyLibrary[1]、Stanford大学数字图书馆Fab系统[2]、NEC研究院的CiteSeer系统[3]等都以不同形式向用户提供了个性化信息服务。如何构建一个有效的个性化信息推荐系统,快速高效地从海量的数据和信息中获取有关知识,提高资源检索和推荐的智能水平,满足各类用户不同的个性化需求,已成为数字图书馆领域研究的一项重要内容。
作为个性化推荐系统的核心技术,协同过滤是当前应用最广、研究最多的推荐技术,它根据与目标用户兴趣相似的邻居用户的偏好信息产生对目标用户的推荐。协同过滤技术主要通过其他用户对项目的评价进行推荐,无需考虑推荐内容的形式,相比信息检索、基于内容的推荐等技术,具有一定的优越性,Amazon、CDNow、MovieFinder等都采用了协同过滤的技术来提高服务质量。但随着系统用户和资源数量的急剧增长,协同过滤技术也存在冷启动问题、最初评价问题、和扩展性问题等[4]。本文提出了一种基于协同过滤盒模糊聚类相结合的推荐技术,通过对用户文献资源使用记录的分析,得到用户的文献偏好类别及权值,建立用户兴趣模型,在此基础上,使用FCM算法对用户进行聚类分析,得到相似用户的Top_n最近邻居集,从而出生推荐。
1用户兴趣建模
1.1用户兴趣的收集与表示数字图书馆环境下,用户兴趣信息主要包括:用户注册信息、图书借阅记录、用户定制信息、Web服务器日志等,这些数据的收集主要包括显性收集方式和隐性收集方式两种[5]。用户兴趣信息收集好后,需要对这些数据进行预处理,包括数据清理、格式转化、归一化处理等步骤,本文不再赘述。
对用户兴趣信息进行预处理后,下一步工作就是如何表示用户对某一类资源的兴趣爱好。本文依据中图法来对文献资源进行分类,并通过建立“多层分类树”的方式来表示读者对各类文献资源的兴趣爱好,如图1所示为某一用户计算机技术领域的“多层分类树”。
图1中,每个结点(分类)都有一个权值,其中父亲点的权值为其子结点之和,所有叶子结点的权值之和为1。每个结点包含子结点及与同层结点的关系(关联程度),如某一读者对“算法设计”领域的兴趣权值为0.1022,同时与之相关的领域信息有(数据库,0.72),(数据结构,0.63),后面的数字为与“算法设计”的相关度。各类文献资源的相关度值可以由专家指定,也可以通过数据挖掘方
您可能关注的文档
- 基于多变量模糊控制理论的输电线路覆冰状态研究.doc
- 基于多传感器的温室环境数据融合算法研究.doc
- 基于多媒体的高职化学教育改革研究.doc
- 基于多元统计分析的我国各地区城镇居民消费性支出研究.doc
- 基于多元线性回归模型的城乡居民收入差距影响因素实证研究.doc
- 基于房建工程的新型地下室施工中防水技术应用研究.doc
- 基于非主流文化引导的高职生之思政教育.doc
- 基于分块的网页内容提取算法的研究.doc
- 基于分形技术的竹生长模拟研究.doc
- 基于高层建筑施工中的重点问题分析研究.doc
- 2025年公园健身设施智能化改造对城市社区体育发展的推动作用报告.docx
- 2025年公园健身设施能耗优化与节能技术引进报告.docx
- 2025年公园健身设施智能化改造项目实施策略.docx
- 2025年公园健身设施能耗优化与能源消耗降低策略报告.docx
- 小学英语课堂生成式AI辅助下的词汇教学策略研究与实践教学研究课题报告.docx
- 基于物联网技术的电商包装废弃物回收系统设计与实现教学研究课题报告.docx
- 《沉浸式VR在建筑施工安全教育培训中的创新实践与案例分析》教学研究课题报告.docx
- 高中教师数字素养提升与个性化职业发展规划研究教学研究课题报告.docx
- 编制老师考试题库及答案.doc
- 《历史大概念教学在初中历史教学中的教学策略优化》教学研究课题报告.docx
最近下载
- 检测单位各部门岗位职能职责.doc VIP
- 2025内蒙古鄂尔多斯市公安机关招聘留置看护警务辅助人员115人笔试参考题库附答案解析.docx VIP
- 模电教案-李国丽.doc
- 2023版中国结直肠癌及癌前病变内镜诊治共识PPT课件.pptx VIP
- 证监会现场核查工作底稿-A股首次公开发行IPO保荐底稿.docx VIP
- UIC513-1994铁路车辆乘坐舒适性评估.pdf VIP
- 2025年医学课件-右心声学造影.pptx VIP
- 企业内部控制培训课件完整版(164页PPT).ppt VIP
- 2024年秋人教版七年级英语上册全册课件:Unit 7.pptx VIP
- Unit 6 A day in the life Section B (课件)-2024-2025学年人教版英语七年级上册.pptx VIP
文档评论(0)