FOCoR-一种基于特征选择优化的课程技术.docxVIP

FOCoR-一种基于特征选择优化的课程技术.docx

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
? ? FOCoR:一种基于特征选择优化的课程推荐技术 ? ? 王 扬,陈 梅,李 晖 (贵州大学计算机科学与技术学院,贵州 贵阳 550025) 0 引 言 课程推荐是在线教育领域解决学习者和课程快速匹配的关键。主流推荐算法通常会基于显式的课程评分反馈进行分析,但是由于用户一般很少主动地对课程进行评分,因而高质量数据通常不足且容易导致用户与推荐课程的匹配度并不高。在线教育平台的行为日志能够较真实地反映用户的课程学习偏好,而且数据也相对容易获取,因此基于用户行为日志作为隐式反馈课程推荐算法的研究越来越多。 基于行为日志的推荐系统规避了评分数据获取困难的窘境,但是在日志数据不足的情况下依然存在着严重的用户冷启动问题。本文针对在线教育平台中行为日志推荐系统存在的冷启动问题,设计一种融合高校选课数据的基于特征选择优化的课程推荐方法FOCoR (Features Optimization based Courses Recommendation)。在FOCoR的研究过程中,本文提出基于遗传算法的特征选择技术FSBGA (Feature Selection Based on Genetic Algorithm),构造出结合模型损失和特征数量的适应度函数,并在高校选课数据的特征子集空间中搜索出兼顾模型损失和特征数量的最优特征子集作为推荐模型的输入,然后基于梯度提升树LightGBM技术构建推荐模型进行课程推荐。为了验证FOCoR方法的有效性,本文在某高校的真实数据集上进行了实验分析。 1 相关工作 推荐模型所需的部分输入数据缺失是产生冷启动问题的根本原因。一些研究借助其它类型的数据来应对冷启动问题,这一类方法被称为基于辅助数据的方法[1]。常用的辅助数据包括用户人口统计学数据、社交网络数据、情景信息等。首先,简要回顾部分解决方案。Raigoza等人[2]利用人口统计学特征将用户分为不同群组,进而基于项目在相似特征用户群组中的流行程度或热度进行推荐。巫可等人[3]利用人口统计学数据的隐语义推荐模型,通过属性映射,解决了协同过滤算法的冷启动问题。Lika等人[4]在基于人口统计学特征对用户分类的基础上,设计了评分预测函数,基于同组用户的评分对新用户进行推荐。Park等人[5]关注了自适应学习环境下的冷启动问题,面向新用户提出一种基于用户背景信息的方法。此外,自适应学习系统可以根据用户学习能力为用户定制个性化学习环境,也有助于解决用户冷启动问题。 随着社交网络的广泛应用,越来越多的研究尝试利用社交网络数据改善推荐系统性能或进行推荐,这类推荐也被称为社会化推荐[6]。用户基本情况数据、用户与朋友的交互数据、用户与其所属机构的关联数据等都可以用于推荐[7]。社交网络数据也为冷启动问题的缓解提供了有力支持。Sahebi等人[8]用社区发现技术从社会化网络中识别社区,在社区内计算新用户的最近邻进行协同过滤。Nguyen等人[9]在社区发现与识别的基础上计算社区中所有用户对特定项目的偏好,这一社区偏好可用于解决协同过滤中的数据稀疏和新用户冷启动问题。Zhang等人[10]利用社交网络数据对用户静态偏好和动态偏好建模,可以缓解新用户冷启动问题。 情境信息也称为上下文信息,是任何可以用于描述一个实体情况特征的信息,例如时间、空间、设备、环境等。利用情境信息实施推荐的系统成为情境感知推荐系统信息推荐领域重要的发展方向之一[11]。引入情境信息不仅可以提高推荐模型的准确率,还有利于缓解冷启动问题。于洪等人[12]同时考虑用户、标签、项目属性、时间因子之间的关系,在基于图的模型基础上,进行个性化评分预测,以此解决项目冷启动问题。Chen等人[13]提出一种协同过滤的Web服务QoS(Quality of Service)预测方法,该方法将用户和Web服务在地理空间上近邻的数据整合到矩阵分解模型中,可以缓解评分数据的稀疏和冷启动,提高预测准确性。Viktoratos等人[14]从Foursquare收集用户的登录信息,通过关联规则挖掘建立用户登录日期、时间段、天气与POI(兴趣点)类别的关联,基于这种关联规则为用户推荐POI,新项目的推荐可以基于其所属的类别实现。Tian等人[15]在基于项目流行度推荐的基础上,引入时间和空间2种情境信息计算情境化的流行度,为新用户进行推荐。 关联开放数据(Linked Open Data, LOD)项目的发展为数据密集型任务提供了获取所需信息的便捷方式,LOD要求用户以RDF格式发布数据,并通过RDF三元组建立与其他数据集合的关联。一些研究引入LOD数据用以缓解推荐系统的冷启动问题。例如,Wang等人[16]提出一种关联数据驱动的数字图书推荐模型,把图书馆的本地数据与外部相关的关联数据相融合,根据图书馆资源信息的不同的特性

文档评论(0)

科技之佳文库 + 关注
官方认证
文档贡献者

科技赋能未来,创新改变生活!

版权声明书
用户编号:8131073104000017
认证主体重庆有云时代科技有限公司
IP属地上海
统一社会信用代码/组织机构代码
9150010832176858X3

1亿VIP精品文档

相关文档