- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于内容过滤的个性化农业信息推荐模型研究(行业资料)
文档信息
:
文档作为关于“行业资料”中“毕业资料”的参考范文,为解决如何写好实用应用文、正确编写文案格式、内容素材摘取等相关工作提供支持。正文7174字,doc格式,可编辑。质优实惠,欢迎下载!
目录
TOC \o 1-9 \h \z \u 目录 1
正文 1
文1:基于内容过滤的个性化农业信息推荐模型研究 1
文2:基于协同过滤的个性化食材推荐算法研究 6
1 引 言 6
2 协同过滤推荐算法概述 7
3 根据饮食习惯的食材推荐 7
第三步,选取k个近邻,加权并筛选和推荐。 8
4 系统测试 9
参考文摘引言: 11
原创性声明(模板) 12
文章致谢(模板) 13
正文
基于内容过滤的个性化农业信息推荐模型研究(行业资料)
文1:基于内容过滤的个性化农业信息推荐模型研究
1.2 用户兴趣模型的表示
杨艳等[5]提出的将兴趣粒度表示法和向量空间模型表示法结合起来的显隐式结合用户模型,在用户兴趣爱好固定的情况下取得了比较好的效果。但用户的兴趣爱好不是一成不变的,本研究借鉴了该模型的思想,根据农业信息化综合服务平台的特点,构造可更新用户兴趣类别的用户兴趣模型。
农业信息化综合服务平台中的信息是分类显示的,因此把用户的兴趣爱好表现在信息的类别上。把用户的每一个感兴趣的类别和对该类别感兴趣的程度用一个向量表示,称为类别兴趣向量,定义为CI=<(C1,W1),(C2,W2),…,(Cm,Wm)>其中m为用户感兴趣的类别个数,Cj为第j个类别,Wj为
2 用户兴趣模型的实现
目前,在信息处理方向上,文本的表示主要采用向量空间模型[11]。用空间向量模型表示文本,首先要对文本进行分词,进行特征选择和权重计算,最后形成一个N维空间向量[12]
2.1 特征词权重的计算
权重的计算有多种方法,主要有布尔函数、频度函数、开根号函数、对数函数、熵函数及TF*IDF函数等,TF*IDF函数因其算法相对简单、有较高的准确率和召回率,一直受到相关研究人员和众多应用领域的青睐[13]。Salton在1973年提出的TF*IDF启发式权重算法计算公式[14]为:
W(fi,d)=TF(fi,d)×DIF(fi)=N(fid)×log(N(fi)/N)(1)
其中,W(fi,d)是特征词fi在文本d中的权重,N(fi)是出现特征词fi的文本数,N是总文本数,N(fid)是文本d中出现fi的次数。
施聪莺等[12]对“考虑类间类内差异的TF*IDF”、“TF*IWF*IWF”、“引入方差的TF*IWF*IWF”及“TF*IDF频率”算法进行测试,“引入方差的TF*IWF*IWF”无论是在开放测试还是在封闭测试中,F1测试值都非常高,反映了方差在抑制干扰方面的作用。本研究采用陈克利等[13]提出的“引入方差的TF*IWF*IWF”权重算法进行计算。
特征词在类别中的权重计算公式:
心理学研究认为,人的记忆会随着时间的延续而逐渐遗忘,当环境或场合的改变使得记忆中的某些信息长期不被利用时,这些信息会逐渐被遗忘。根据心理学的记忆遗忘理论,可以认为用户兴趣的改变就是一种记忆遗忘现象[16]。目前对遗忘机制的研究是把时间对兴趣的影响通过遗忘函数或遗忘因子来表示出来,并更新用户的兴趣。遗忘函数或遗忘因子有着不同的公式表示,有指数函数[16-21]、线性函数[22-26]、菲波拉契数列[27]、幂函数[28]、对数函数[29]、分段函数[30]、非线性函数[31-33]等。于洪等[28]用ZGrapher工具对艾宾浩斯遗忘曲线进行拟合,得到符合遗忘曲线的数学函数:
百度百科的“遗忘曲线”词条[34]给出了艾宾浩斯记忆遗忘一般规律,得出初次记忆后经过了X小时,记忆率Y近似地满足:
对公式(6)~(8)进行运算,公式(7)最符合艾宾浩斯遗忘曲线,但公式(7)缺少31 d以后的表示。31 d以后的记忆趋于稳定,所以把31 d以后设置为固定值0.211,修改后的公式为公式(9)
其中,t为正整数。
采用公式(10)对特征词在类别和文档中的权重进行动态更新。特征词的权重按照公式(2)和(3)进行特征词加权修订后和公式(10)之乘积进行计算。文档中的权重也要计算,因为文档越新,对用户的价值越大,公式(10)对类别和文档进行计算时,t可以取不同的值。
2.2 特征向量的构造
特征向量的构造过程如下:
1)分析服务器日志,去掉与日志无关的信息,如请求失败信息、页面图片请求等等,把用户有效的访问信息保存到数据库中[4]
2)获取用户浏览的新闻资讯页面、论坛中发布及回复的帖子、便民服务的教育期刊网 http:
关键词 、短信提问的问题,进行中文分词,去除停用词。对于中文分
您可能关注的文档
最近下载
- 现代供配电课程设计-某机械厂降压变电所的电气设计.docx VIP
- 《现代西班牙语》第一册课文答案.doc VIP
- 中考纲英语词汇表及翻译中考英语词汇表及翻译中考纲英语词汇表及翻译中考纲英语词汇表及翻译.doc VIP
- KAT 22.2-2024 矿山隐蔽致灾因素普查规范第2部分:煤矿.docx VIP
- 老年肌少症PPT课件.pptx VIP
- 新苏教版一年级数学上册《10的加减法》公开课教案.doc VIP
- KA_T 22.1-2024 矿山隐蔽致灾因素普查规范 第1部分:总则.docx VIP
- 一氧化氮吸入疗法临床应用专家共识(2024版)解读 课件.pptx VIP
- 《严重过敏反应的紧急护理》课件.ppt VIP
- 中等职业学校公共基础课程《中国书画》PPT教学课件.pptx VIP
文档评论(0)