基于内容过滤的个性化农业信息推荐模型研究（行业资料）.docVIP

下载本文档

0
0
约8.91千字
约 13页
2022-08-02 发布于广东
举报
版权申诉

基于内容过滤的个性化农业信息推荐模型研究（行业资料）.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于内容过滤的个性化农业信息推荐模型研究（行业资料）文档信息：文档作为关于“行业资料”中“毕业资料”的参考范文，为解决如何写好实用应用文、正确编写文案格式、内容素材摘取等相关工作提供支持。正文7174字，doc格式，可编辑。质优实惠，欢迎下载！目录 TOC \o 1-9 \h \z \u 目录 1 正文 1 文1：基于内容过滤的个性化农业信息推荐模型研究 1 文2：基于协同过滤的个性化食材推荐算法研究 6 1 引言 6 2 协同过滤推荐算法概述 7 3 根据饮食习惯的食材推荐 7 第三步，选取k个近邻，加权并筛选和推荐。 8 4 系统测试 9 参考文摘引言： 11 原创性声明（模板） 12 文章致谢（模板） 13 正文基于内容过滤的个性化农业信息推荐模型研究（行业资料）文1：基于内容过滤的个性化农业信息推荐模型研究１．２用户兴趣模型的表示杨艳等［５］提出的将兴趣粒度表示法和向量空间模型表示法结合起来的显隐式结合用户模型，在用户兴趣爱好固定的情况下取得了比较好的效果。但用户的兴趣爱好不是一成不变的，本研究借鉴了该模型的思想，根据农业信息化综合服务平台的特点，构造可更新用户兴趣类别的用户兴趣模型。农业信息化综合服务平台中的信息是分类显示的，因此把用户的兴趣爱好表现在信息的类别上。把用户的每一个感兴趣的类别和对该类别感兴趣的程度用一个向量表示，称为类别兴趣向量，定义为ＣＩ=＜（C1，W1），（C2，W2），…，（Cm，Wm）＞其中ｍ为用户感兴趣的类别个数，Cj为第ｊ个类别，Wj为２用户兴趣模型的实现目前，在信息处理方向上，文本的表示主要采用向量空间模型［１１］。用空间向量模型表示文本，首先要对文本进行分词，进行特征选择和权重计算，最后形成一个Ｎ维空间向量［１２］２．１特征词权重的计算权重的计算有多种方法，主要有布尔函数、频度函数、开根号函数、对数函数、熵函数及ＴＦ*ＩＤＦ函数等，ＴＦ*ＩＤＦ函数因其算法相对简单、有较高的准确率和召回率，一直受到相关研究人员和众多应用领域的青睐［１３］。Ｓａｌｔｏｎ在１９７３年提出的ＴＦ*ＩＤＦ启发式权重算法计算公式［１４］为：Ｗ（ｆｉ，ｄ）＝ＴＦ（ｆｉ，ｄ）×ＤＩＦ（ｆｉ）＝Ｎ（ｆｉｄ）×ｌｏｇ（Ｎ（ｆｉ）／Ｎ）（１）其中，Ｗ（ｆｉ，ｄ）是特征词ｆｉ在文本ｄ中的权重，Ｎ（ｆｉ）是出现特征词ｆｉ的文本数，Ｎ是总文本数，Ｎ（ｆｉｄ）是文本ｄ中出现ｆｉ的次数。施聪莺等［１２］对“考虑类间类内差异的ＴＦ*ＩＤＦ”、“ＴＦ*ＩＷＦ*ＩＷＦ”、“引入方差的ＴＦ*ＩＷＦ*ＩＷＦ”及“ＴＦ*ＩＤＦ频率”算法进行测试，“引入方差的ＴＦ*ＩＷＦ*ＩＷＦ”无论是在开放测试还是在封闭测试中，Ｆ１测试值都非常高，反映了方差在抑制干扰方面的作用。本研究采用陈克利等［１３］提出的“引入方差的ＴＦ*ＩＷＦ*ＩＷＦ”权重算法进行计算。特征词在类别中的权重计算公式：心理学研究认为，人的记忆会随着时间的延续而逐渐遗忘，当环境或场合的改变使得记忆中的某些信息长期不被利用时，这些信息会逐渐被遗忘。根据心理学的记忆遗忘理论，可以认为用户兴趣的改变就是一种记忆遗忘现象［１６］。目前对遗忘机制的研究是把时间对兴趣的影响通过遗忘函数或遗忘因子来表示出来，并更新用户的兴趣。遗忘函数或遗忘因子有着不同的公式表示，有指数函数［１６－２１］、线性函数［２２－２６］、菲波拉契数列［２７］、幂函数［２８］、对数函数［２９］、分段函数［３０］、非线性函数［３１－３３］等。于洪等［２８］用ＺＧｒａｐｈｅｒ工具对艾宾浩斯遗忘曲线进行拟合，得到符合遗忘曲线的数学函数：百度百科的“遗忘曲线”词条［３４］给出了艾宾浩斯记忆遗忘一般规律，得出初次记忆后经过了Ｘ小时，记忆率Ｙ近似地满足：对公式（６）～（８）进行运算，公式（７）最符合艾宾浩斯遗忘曲线，但公式（７）缺少３１ｄ以后的表示。３１ｄ以后的记忆趋于稳定，所以把３１ｄ以后设置为固定值０．２１１，修改后的公式为公式（９）其中，ｔ为正整数。采用公式（１０）对特征词在类别和文档中的权重进行动态更新。特征词的权重按照公式（２）和（３）进行特征词加权修订后和公式（１０）之乘积进行计算。文档中的权重也要计算，因为文档越新，对用户的价值越大，公式（１０）对类别和文档进行计算时，ｔ可以取不同的值。２．２特征向量的构造特征向量的构造过程如下：１）分析服务器日志，去掉与日志无关的信息，如请求失败信息、页面图片请求等等，把用户有效的访问信息保存到数据库中［４］２）获取用户浏览的新闻资讯页面、论坛中发布及回复的帖子、便民服务的教育期刊网 http: 关键词、短信提问的问题，进行中文分词，去除停用词。对于中文分