- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第37 卷第4 期 地 理 研 究 Vol.37, No.4
2018 年4 月 GEOGRAPHICAL RESEARCH April, 2018
基于混合过滤的地学数据个性化推荐方法设计与实现
1,2 3 4,5,6 4,5
王 末 ,郑晓欢 ,王卷乐 ,柏永青
(1. 中国农业科学院农业信息研究所,北京 100081;2. 农业部农业大数据重点实验室,北京 100081;
3. 中国科学院办公厅,北京 100864;4. 中国科学院地理科学与资源研究所,资源与环境信息系统国家重点
实验室,北京 100101;5. 中国科学院大学,北京 100049;6. 江苏省地理信息资源开发与利用协同创新中
心,南京 210023 )
摘要:推荐系统是帮助互联网用户克服信息过剩的有效工具。在地学数据共享领域,较其他
物品的内容属性,地学数据具有更加丰富的时空属性,这也给地学数据推荐带来挑战。针对地
学数据的特点,为地学数据共享推荐服务开发了一种动态加权的混合过滤方法。该方法分别
采用协同过滤和基于内容过滤算法预测用户对数据的兴趣度,再以训练模型计算最优加权权
重,计算最终预测评分。在数据获取阶段,通过用户访问日志数据,采用Jenks Natural Break 算
法分析用户访问记录获取用户的数据兴趣度。在基于内容过滤部分,通过数据的空间、时间及
内容属性计算数据相似度,并以用户历史行为为依据计算用户兴趣。在协同过滤和基于内容
过滤中分别采用k-NN 算法计算用户对未访问数据的预测评分,并进行加权求和。通过训练
集,对理想权重值及用户的共同评价度(co-rating level )进行建模,拟合二者的关系。该模型被
应用于混合过滤的权重调整,以获得最优的加权方程。测试结果显示,结合数据时空属性的混
合过滤方法的准确度和召回率,较单一的协同过滤或基于内容过滤方法有显著提高。
关键词:地理空间数据;推荐系统;混合过滤;科学数据共享
DOI: 10.11821/dlyj201804014
1 引言
[1]
数据是进行科学研究的基本条件 。当今,地学领域每天以前所未有的速度产生、收
集和储存了海量的科学数据。数据共享是有效利用这些数据重要的途径。资源查找是数
据共享服务提供的基本功能之一。然而,地学数据内在属性包括空间、时间和主题内容
信息,基于传统的检索技术可能不能满足用户对数据属性的需求。面对海量的数据,科研
人员将面临如何发现所需数据的难题。个性化推荐是解决这一信息过剩问题的有效途径。
[2-4]
个性化推荐系统已在多个领域得到成功地应用,包括多媒体内容 (音乐、电影等) 、
[5,6] [7,8] [9,10]
网络教学 、电子商务 、网络搜索 等。但在目前仍缺乏针对科学数据共享服务设计
的个性化推荐方法。
个性化推荐系统是一种能够学习用户偏好,并基于用户偏好预测用户需求,在大量
[11]
的可能选项里给出个性化推荐的Web 应用系统 。常见的个性化推荐算法类型有协同过
收稿日期:2017-10-11; 修订日期:2018-02-01
基金项目:国家科技基础条件平台建设项目 (2005DKA32300);中国科学院特色研究所培育建设服务项目
(TSYJS03 );中国工程科技知识中心建设项目 (CKCEST-2017-3- 1);农业科学数据挖掘分析平台研究与
建设项目 (JBYW-AII-2017-32);中国农业科学院科技创新工程项目 (CAAS-ASTIP-2016-AII)
作者简介:王末 (1987-
您可能关注的文档
- 黄土高原地区NDVI与气候因子空间尺度依存性及非平稳性研究.pdf
- 黄土高原地区人类活动强度时空变化分析.pdf
- 混合功能驱动下的海岛聚落范式与空间形态解析——浙江舟山地区的产住共同体实证.pdf
- 混杂性:关于乡村性的再认识.pdf
- 基于“城—村—地”三维视角的农村居民点整理策略——以江苏省新沂市为例.pdf
- 基于“强度—潜力—难度”综合测度的中国农用地整治实施协调性分析.pdf
- 基于“三生”视角的乡村功能分区及调控——以长株潭地区为例.pdf
- 基于“重要性—敏感性—连通性”框架的云浮市生态安全格局构建.pdf
- 基于BDI决策的居住空间宜居性分析——以大连沙河口区为例.pdf
- 基于CAS理论的传统村落人居环境演化研究——以张谷英村为例.pdf
- 基于货物结构的中国沿海港口运输职能判别.pdf
- 基于交通通达性的关中—天水经济区县际经济联系测度及时空动态分析.pdf
- 基于交通网络视角的跨界旅游区合作的微观机制研究——以武陵山区为例.pdf
- 基于交通信息流的长三角地区网络空间结构及其效率研究.pdf
- 基于结构方程模型的西宁城市居民通勤行为及其影响因素.pdf
- 基于开发利用与产出视角的区域土地利用隐性形态综合研究——以黄淮海地区为例.pdf
- 基于空间差异的黑河中游土地多功能利用研究.pdf
- 基于空间区位条件的城市扩展生态阻力面模型及应用.pdf
- 基于理性选择理论的社区环境对入室盗窃的影响研究.pdf
- 基于历史制度分析的珠江三角洲非国有经济演化.pdf
原创力文档


文档评论(0)