科学数据用户相关性判断模型研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘 要 在开放科学环境和“数据密集型”科学研究范式的驱动下,科学数据的重要性持续提升。 在 FAIR 原则和关联数据技术的影响下,更多的科学数据以富含语义的形式进入网络传播。 然而,我们对科学数据用户如何做出某条科学数据相关与否的判断过程知之甚少。因此,本 研究以科学数据用户相关性判断行为及其认知机理为研究切入点,理解和建模科学数据用户 相关性判断过程,以期丰富和拓展信息科学领域相关性研究,同时为科学数据专属的搜索技 术研发提供理论基础。 相关性是信息科学的基础概念之一,理解用户对特定类型信息对象做出相关性判断的过 程、原理、影响因素以及作用效果,始终是信息科学特别是信息检索学者们的关注点。学者 们先后研究了科技论文、文本文档、网页、多媒体、社交媒体等多种类型的相关性,大数据 以及科学数据的相关性是最近的关注,并且因其区别于其他信息类型的认知和技术特点而吸 引了越来越多的研究兴趣。 本论文尝试以实证的方式构建科学数据用户相关性判断模型。通过对用户相关性判断过 程的描述、核心认知过程量化验证和模型的算法化设计,进而为科学数据搜索与推荐提供理 论基础。为此,本研究在综述已有研究的基础上提出了认知导向的相关性判断假设性概念模 型和相应的研究目标。并基于此,顺次开展了三个层次的实证研究:1)科学数据用户相关 性判断描述性概念模型研究;2 )科学数据用户相关性判断实证性量化模型研究;3 )多标准 相关性排序(Multi-Criteria Relevance Ranking, MCRR )算法及其应用框架设计。 本研究共得出以下研究结论:首先,论文通过静态要素识别验证了科学数据用户相关性 判断描述性概念模型。模型中识别了 24 个科学数据信息元(Scientific Data Information Elements, SDIEs)、3 类决策规则、12 个一级相关性标准、4 类相关性标准维度。基于此,论 文提出了TAQA-U(Topicality, Availibility, Quality, Authority and Usefulness)科学数据用户相关 性标准结构,为用户导向的科学数据查询与检索实践提供了“静态”指导原则。 其次,基于偏最小二乘结构方程模型 (Partial Least Squares Structural Equation Modeling, PLS-SEM)量化方法,实证验证了科学数据查询与检索交互过程中科学数据相关性标准使用 结构模型,即科学数据用户相关性判断实证性量化模型。论文验证了主题相关性标准在用户 相关性判断中的先决条件作用,验证了可用性、质量和权威性的中介作用,验证了有用性作 为科学数据用户判断数据对象的结果变量。同时,研究实证验证了科学数据用户相关性判断 的个性化认知模式主要体现在相关性标准动态组合使用的差异上。 最后,基于描述性概念模型和实证性量化模型研究发现与结果,研究设计了多标准相关 性排序(MCRR )算法及其应用框架。该算法综合考虑了用户多标准相关性判断的认知本质: 1)综合计算多标准得分,而非主题词匹配模式下的单一维度相关性;2 )引入优先级算子计 算不同标准(集)之间的等级关系。同时,研究提出了认知导向的科学数据检索与推荐框架 以支撑个性化科学数据检索与推荐实践。 综合以上研究结果与发现,论文的主要学术贡献与创新体现在:1)论文从三个水平(描 述性概念模型/实证性量化模型/算法化表达)创新地提出并验证了科学数据用户相关性判断 I 模型。同时,将用户相关性判断研究对象拓展到科学数据及其用户,在理论上丰富和发展了 用户相关性研究进程。2 )探索了从描述性概念模型到量化模型到算法表达的连续性用户相 关性判断研究路径;3 )提出了认知导向的科学数据检索与推荐框架,为智能、个性化科学 数据检索与推荐提供了理论基础。 未来研究将在理论和实践上进一步丰富和发展认知导向的科学数据查询与检索研究。在 理论上,扩大研究情境(如科学数据与科技文献的关联搜索)和用户类型(如专门针对科学 数据领域专家),完善和发展已有理论模型;在实践上,以个性化科学数据检索与推荐为切 入点,开发认知导向的科学数据查询与推荐系统,提升科学数据的复用率和价值,支撑开放 科学背景下的科研创新。 关键词:相关性判断模型,科学数据,科学数据检索,相关性排序算法

文档评论(0)

136****6583 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档