基于Prefuse和社会网络算法的信息检索的关系分析.docVIP

基于Prefuse和社会网络算法的信息检索的关系分析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Prefuse和社会网络算法的信息检索的关系分析 文档信息 主题: 关于“IT计算机”中“数据结构与算法”的参考范文。 属性: Doc-0291PZ,doc格式,正文8221字。质优实惠,欢迎下载! 说明: 作为文学资料、新闻资料的写作参考资料,提供解决怎么写及格式等相关问题。 适用: 作为文章写作的参考文献,解决如何写好实用应用文、正确编写文案格式、内容摘取等相关工作。 目录 TOC \o 1-9 \h \z \u 目录 1 正文 1 文1:基于Prefuse和社会网络算法的信息检索的关系分析 2 1 基于Prefuse的知识图谱系统设计 2 2 信息检索学科分析的知识图谱构建 3 3 信息检索合作网络知识图谱的解读 6 4 结语 8 文2:信息检索中语义分析算法的运用 8 1语义分析技术应用领域和价值 8 2基于语言分析的搜索引擎文本处理方法 9 3分词权重设置 11 4主题模型(Topic Model)应用于信息检索的方法 11 5图片语义分析法在图片搜索中的应用 13 参考文摘引言: 14 原创性声明(模板) 14 文章致谢(模板) 15 正文 基于Prefuse和社会网络算法的信息检索的关系分析 文1:基于Prefuse和社会网络算法的信息检索的关系分析 近年来,随着多种知识图谱分析工具的出现,一些研究者利用知识图谱软件(主要是CiteSpaceⅡ)对信息检索学科进行了分析,如Rorissa A和Yuan X(2011)在2000~2009年数据的基础上用CiteSpaceⅡ对信息检索学科进行知识图谱构建和学科分析[1];国内同样有学者利用该软件对信息检索的子领域进行分析,但这些研究存在数据源时间跨度短、在一定程度上依赖于知识图谱软件的功能,而且未对信息检索学科合作网络进行分析研究。通过上述考虑,本文尝试一种新的知识图谱框架,基于该框架通过社会网络算法构建信息检索合作网络并进行解读,以便为国内外从事信息检索研究的有关学者提供参考借鉴。 1 基于Prefuse的知识图谱系统设计 2005年,Heer J、Card SK、Landay JA三人共同撰文提出了Prefuse的信息可视化框架[2]。Prefuse为数据建模、数据可视化以及用户交互提供了丰富的软件库,可以支持表格、图和树显示,还具有支持动态显示、动态查询等功能。Prefuse基于传统的MVC架构进行开发,其可视化时需要经过如下处理过程[3] (1)抽象数据(Abstract Data)。Prefuse对数据进行可视化的首要步骤是获取数据,并为数据提供了指定的接口和程序,可以显示表、图和多种树形结构。本文主要使用XML格式的数据,通过把数据转化成XML格式,如DOITrees、GraphML、TreeML格式,完成抽象数据的处理过程。 (2)数据过滤(Filtering)。主要是将抽象数据进行提取、转化,使其适用于显示。首先选取要进行可视化的一系列元素,如一个图形或显示在散点图上的重点区域。然后形成一些可视化的属性(称为VisualItems),如源数据中显示的文字、数字,显示时的坐标点、颜色、大小等等。然后通过Action提供为上层组件。 (3)数据渲染(Rendering)。即图形绘制的过程,可视化元素(VisualItems)通过渲染器(Rendere)绘制到屏幕上,其中用到上面形成的组件如颜色、位置、大小等等。Prefuse实现了一些基本渲染器,通过渲染器工厂RenderFactory进行管理。 (4)交互显示(Interactive Display)。功能由Display组件完成,用于显示ItemRegistry中注册的组件。可视化交互功能通过ControlListener接口实现,主要是提供对鼠标、键盘的监听功能。 本文通过对数据的预处理、数据抽取、矩阵形成,进行聚类或社会网络以后,把生成结果转化成Prefuse可支持的TreeML、GraphML格式,借助Prefuse可视化框架,完成聚类显示、社会网络显示的功能。 2 信息检索学科分析的知识图谱构建 数据源获取 本研究数据来源于Web of Science的SCI-EXPANDED、SSCI、AHCI、CPCI-S、CPCI-SSH数据库,用“Information Retriev*”作主题检索,检索时间选择20世纪50年代至今(截止至2011年11月25日),词形还原打开,得到的检索结果共计46561条记录。以此作为构建信息检索学科知识图谱的数据集,以下简称为“数据集” 数据处理 (1)提取作者数据。在原数据库中,通过数据表paper的“autho”字段,可以获得每篇文献的作者数据,在作者字段中,为

您可能关注的文档

文档评论(0)

ayun1990 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档