基于关联领域的文献趋势分析系统的设计与实现-软件工程专业论文.docxVIP

基于关联领域的文献趋势分析系统的设计与实现-软件工程专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关联领域的文献趋势分析系统的设计与实现-软件工程专业论文

华中科技大学硕士学位论文 华 中 科 技 大 学 硕 士 学 位 论 文 PAGE IV PAGE IV Compared with other systems, our system is in a leading position on accuracy and response rate. And the last statistic information about the generation of emerging trends in word is convenient for subsequent analysis. The graphical interface even makes the trend having a very direct result display. Key word:Vector space model Cluster analysis Theme detection Emerging trends detection 目 录 摘 要 I Abstract II 1 绪论 1.1 研究背景 (1) 1.2 国内外研究现状 (2) 1.3 论文研究工作与组织结构 (7) 2 相关背景与技术研究 2.1 文献关联分析 (9) 2.2 文本聚类 (13) 2.3 本章小结 (19) 3 系统需求分析与设计 3.1 系统背景 (21) 3.2 需求分析 (21) 3.3 系统功能需求 (23) 3.4 系统架构设计 (24) 3.5 系统功能设计 (26) 3.6 本章小结 (37) 4 系统实现和测试 4.1 系统实现 (38) 4.2 系统测试与分析 (44) 4.3 本章小结 (50) 5 总结与展望 5.1 全文总结 (51) 5.2 展望 (51) 致 谢 (53) 参考文献 (54) PAGE 10 PAGE 10 1 绪论 1.1 研究背景 随着科学技术的飞速发展,人类产生的信息量高速增长。尤其是在如今的网络 时代[1],知识的更新和增长更是爆炸性的。在如今的信息化时代,科研工作者的工 作都会放到网上,这给科研人员了解其他科研人员的研究进展以及整个行业的研究 热点和趋势都带来极大的便利。然而网络时代的到来在给我们带来巨大方便的同时 也出现了一个突出的问题:在如此之多的科技文献信息中,如何让科研工作者选择 哪些信息是最有用的,哪些是关系不太大的?这往往会浪费科研工作者太多的时间 在信息的筛选上。更多的时候科研工作者不仅限于对信息的获取,而是要了解隐藏 在这些大量文献背后的信息,比方说文献所涉及的科研领域的发展历程,近几年的 发展状况[2-3],及未来的发展趋势[4-5],这对于一个科研新手来说尤其重要[6-7]。而这 些对于新进如科研领域的科研人员来说需求更是迫切。对目前的领域专家来说,可 得到的数据呈海量的增长[8-9],因此手动仔细的审查而不对信息的分析出现偏差或遗 漏是很困难而且耗时的,进而使得对趋势的分析变得很困难而且不准确。而且各个 领域的发展趋向,特别新兴的领域发展趋向对于一个意欲投身其中的科研人员而言 是十分重要的,因为他们也需要时刻了解自己所在科研领域的进展。种种问题的出 现使得开发基于关联领域的趋势分析系统很有必要。 “随着时间的推移,趋势分析是一个快速发展的研究领域” [10] 。趋势的分析是文 本数据挖掘中一个非常重要的研究课题,所谓趋势是指随着时间推移该领域的走向, 即其发展的方向。也即将来会有越来越多的科研人员投身其中的主题领域。例如: Extensible Markup Language(XML)作为一个趋势在上世纪 90 年代逐渐兴起。在 INSPEC 数据库中搜索关键字“XML”。INSPEC 是一个知名的科学摘要数据库,它涵 盖了计算机科学、电子工程和物理学等学科。检索发现,1994 年相关的文献数仅 3 篇,1996 年 8 篇,1997 年 10 篇,1998 年突增到 170 篇,1999 年更是到达 371 篇。 而在 1994 年之前则是 1 篇都没有。很显然,到 1998 年“XML”已经成为一个主题领 域了存在了。问题的难度在于,趋势的判断不仅仅依赖于所得到的文档集。因为对 于不同人的发表,发文的在不同刊物以及会议的重要程度对该论文的影响力都是有 关系的。 新趋势检测方式的自动化是必要性。其必要性随着信息数字化的日益普及而得 以加强。使这种检测方式的实现变得困难的原因是它不仅以数据收集或探索为基础, 而且还与参与检测过程的人的经验和专业领域有关。目前对人类专家来说有太多的 可得到的数据,因此需要手动仔细的审查而不是会丢失掉重要信息。具有此种性质 的趋势因此主要是基于人力专家对源

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档