- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于内容的新闻推荐系统
项目课题
基于内容的新闻推荐系统
功能描述
网络媒体中, 新闻资讯的数量以近乎爆炸的速度增长, 使广大网络新闻的读者受到“ 信息过载”和“ 信息迷航”问题的困扰 。个性化新闻推荐系统可以通过分析用户使用习惯, 识别用户兴趣点,将用户感兴趣 的新 闻资讯推荐给用户 , 过滤他们不感兴趣的内容 ,而我所作的这个推荐推荐系统就是为了有效地缓解上述问题。
基于内容的新闻推荐系统:它将计算得到并推荐给用户一些与该用户已选择过的项目相似的内容。例如,当你在网上看新闻时,你总是阅读与IT相关的文章,那么基于内容的新闻推荐系统就会给你推荐一些热门的IT方面的文章。
方法描述
基于内容的推荐(Content-based Recommendation)是建立在项目的内容信息上作出推荐的,而不需要依据用户对项目的评价意见,更多地需要用机器学习的方法从关于内容的特征描述的事例中得到用户的兴趣资料。
内容过滤主要采用自然语言处理、人工智能、概率统计和机器学习等技术进行过滤。
通过相关特征的属性来定义项目或对象,系统基于用户评价对象的特征学习用户的兴趣,依据用户资料与待预测项目的匹配程度进行推荐,努力向客户推荐与其以前喜欢的产品相似的产品。
在基于内容的推荐系统中,项目或对象是通过相关的特征的属性来定义,系统基于用户评价对象的特征,学习用户的兴趣,考察用户资料与待预测项目的相匹配程度。用户的资料模型取决于所用学习方法,常用的有决策树、神经网络和基于向量的表示方法等。基于内容的用户资料是需要有用户的历史数据,用户资料模型可能随着用户的偏好改变而发生变化。
要实现内容推荐系统总体来说要经过4个大的步骤:
1、搜集数据,2、过滤数据,3、分析数据,4 输出结果。
技术难点
难点1:如何实现新闻正文的过滤下载。
难点2:如何对新闻进行量化,并提取出关键词,最后完成数学建模。
难点3:如何利用基于内容的推荐技术为每个用户建立用户模型。
难点4:如何用编程语言实现这些软件功能,这便是该软件设计过程中最最困难的一个难题。
一般在一个个性化推荐系统中,用户对已经看过的对象依据感兴趣程度进行评分,推荐系统根据用户对已查看对象的评分情况,预测用户对未查看对象的评分,并将用户未查看对象按照预测评分的高低排序,呈现给用户。
抽象地看,推荐系统是预测用户对未查看对象评分的系统。而推荐系统对未查看对象的评分方法即为推荐算法。而主要的推荐算法有三类:①、协同过滤的推荐方法、②、基于内容的推荐方法、③、混合的推荐方法。
①、协同过滤是利用集体智慧的一个典型方法。
协同过滤一般是在海量的用户中发掘出一小部分和你品位比较类似的,在协同过滤中,这些用户成为邻居,然后根据他们喜欢的其他东西组织成一个排序的目录作为推荐给你。
比如说,如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?大部分的人会问问周围的朋友,看看最近有什么好看的电影推荐,而我们一般更倾向于从口味比较类似的朋友那里得到推荐。这就是协同过滤的核心思想。
协同过滤相对于集体智慧而言,它从一定程度上保留了个体的特征,就是你的品位偏好,所以它更多可以作为个性化推荐的算法思想。
二、协同过滤的实现步骤:
1)、收集用户偏好
而要从用户的行为和偏好中发现规律,并基于此给予推荐,如何收集用户的偏好信息成为系统推荐效果最基础的决定因素。用户有很多方式向系统提供自己的偏好信息,而且不同的应用也可能大不相同,比如说:
用户行为
类型
作用
评分
显式
通过用户对物品的评分,可以精确的得到用户的偏好
投票
显式
通过用户对物品的投票,可以较精确的得到用户的偏好
转发
显式
通过用户对物品的投票,可以精确的得到用户的偏好。如果是站内,同时可以推理得到被转发人的偏好(不精确)
保存书签
显示
通过用户对物品的投票,可以精确的得到用户的偏好。
标记标签
显示
通过分析用户的标签,可以得到用户对项目的理解,同时可以分析出用户的情感:喜欢还是讨厌
评论
显示
通过分析用户的评论,可以得到用户的情感:喜欢还是讨厌
2)、找到相似的用户或物品
当已经对用户行为进行分析得到用户喜好后,我们可以根据用户喜好计算相似用户和物品,然后基于相似物品进行推荐,这就是最典型的 CF 的分支之一——基于物品的 CF。
3)、计算推荐——基于物品的 CF
比如说,对于物品 A,根据所有用户的历史偏好,喜欢物品 A 的用户都喜欢物品 C,得出物品 A 和物品 C 比较相似,而用户 C 喜欢物品 A,那么可以推断出用户 C 可能也喜欢物品 C。 物品 C 比较相似,而用户 C 喜欢物品 A,那么可以推断出用户 C 可能也喜欢物品 C。
基于物品的 CF
您可能关注的文档
- 2015-2016八上历史期末试题及答案.doc
- 透水砖施工要求(1).doc
- 桃花源记用稿(全国公开课一等奖).ppt
- 胸水、腹水、脑脊液常规及生化检查.ppt
- 七年级上册历史复习提纲.ppt
- 马克思主义基本原理概论资本主义的历史地位和发展趋势.ppt
- 《水的三态变化》ppt课件.pptx
- 七年级下册历史知识框架.doc
- 人教版七年级历史上册第二单元测试题及答案.pdf
- 语文双水2年级.doc
- 2024高考物理一轮复习规范演练7共点力的平衡含解析新人教版.doc
- 高中语文第5课苏轼词两首学案3新人教版必修4.doc
- 2024_2025学年高中英语课时分层作业9Unit3LifeinthefutureSectionⅢⅣ含解析新人教版必修5.doc
- 2024_2025学年新教材高中英语模块素养检测含解析译林版必修第一册.doc
- 2024_2025学年新教材高中英语单元综合检测5含解析外研版选择性必修第一册.doc
- 2024高考政治一轮复习第1单元生活与消费第三课多彩的消费练习含解析新人教版必修1.doc
- 2024_2025学年新教材高中英语WELCOMEUNITSectionⅡReadingandThi.doc
- 2024_2025学年高中历史专题九当今世界政治格局的多极化趋势测评含解析人民版必修1.docx
- 2024高考生物一轮复习第9单元生物与环境第29讲生态系统的结构和功能教案.docx
- 2024_2025学年新教材高中英语UNIT5LANGUAGESAROUNDTHEWORLDSect.doc
文档评论(0)