5基于文献的知识发现工具简介.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * /home RSS RSS Really Simple Syndication Rich Site Summary RDF Site Summary 是一种描述和同步网站内容的格式。一种方便的信息获取工具。 RSS可以干什么 RSS获取信息的模式与加入邮件列表(如电子杂志和新闻邮件)获取信息有一定的相似之处,也就是可以不必登录各个提供信息的网站而通过客户端浏览方式(称为“RSS阅读器”)或者在线RSS阅读方式这些内容。例如,通过一个RSS阅读器,可以同时浏览新浪新闻,也可以浏览搜狐或者百度的新闻。 RSS可以干什么 订阅BLOG:订阅与你有共同爱好的作者的Blog; 订阅新闻; 订阅期刊和PubMed上的相关记录:你可以订阅你工作中所需的技术文章。 你再也不用一个网站一个网站,一个网页一个网页去逛了。只要这将你需要的内容订阅在一个RSS阅读器中,这些内容就会自动出现你的阅读器里,你也不必为了一个急切想知道的消息而不断的刷新网页,因为一旦有了更新,RSS阅读器就会自己通知你! RSS的使用  使用RSS获取信息的前提是,先安装一个RSS阅读器,然后将提供RSS服务的网站加入到RSS阅读器的频道即可。大部分RSS阅读器本身也预设了部分RSS频道,如新浪新闻、百度新闻等。 RSS的使用 RSS阅读器基本可以分为三类。 第一类大多数阅读器是运行在计算机桌面上的应用程序,通过所订阅网站的新闻供应,可自动、定时地更新新闻标题。 国外:Awasu、FeedDemon和RSSReader这三款流行的阅读器,都提供免费试用版和付费高级版。 国内:周博通,看天下,博阅 第二类新闻阅读器通常是内嵌于已在计算机中运行的应用程序中。 NewsGator内嵌在微软的Outlook中,所订阅的新闻标题位于Outlook的收件箱文件夹中。另外,Pluck内嵌在Internet Explorer浏览器中! 第三类则是在线的WEB RSS阅读器,比如国内的 鲜果RSS阅读器。此类在线RSS阅读器的好处就是不需要安装任何软件就可以获得RSS阅读的便利,并且可以保存阅读状态,推荐和收藏自己感兴趣的文章。 RSS的使用 在许多新闻信息服务类网站,会看到按钮,有的网站使用一个图标,有的同时使用两个,这就是典型的提供RSS订阅的标志,这个图标一般链接到订阅RSS信息源的URL。当然,即使不用这样的图标也是可以的,只要提供订阅RSS信息源的URL即可。 本课程学习的重点 数据挖掘的定义 数据挖掘分类 数据挖掘的过程 数据挖掘的算法(2种) 聚类与分类 共现、同被引、引文耦合 可共现分析的字段,说明问题 实习过程(数据挖掘的过程) * * * * * 闭合式知识发现过程是从A和C出发,寻找共同的中间词B。其目的是验证开放式研究发现的一些关系是否有实际的生物学意义。Swanson开发的网络应用软件ARROWSMITH即体现了闭合式挖掘这一思想。在成功预言了镁缺乏与神经系统疾病(1988年)的关系之后,Swanson又利用ARROWSMITH系统成功地预言了消炎痛与阿尔茨海默氏症(1996年)、雌激素与阿尔茨海默氏症(1996年)、游离钙磷脂酶A2与精神分裂症(1998年)之间的关系,并发现了可以作为生物武器的潜在病毒(2001年)。 * * * * 2001年,Swanson 等利用ARROWSMITH发现了还有很多病毒可作为潜在的生物学武器 * * 开放式知识发现的过程是,对某个初始研究主题A,在MEDLINE的标题字段检索其相关文献,寻找与A在标题中共同出现的中间词B,通过筛选得到有一定意义的B,进而重复上述过程,得到目标词C。 开放式挖掘初衷是从某个疾病或药物初始,寻找疾病的潜在病因和治疗方法或者药物的潜在治疗应用。 * * * * * * * * * * 过滤数据 基准率: 在所有已知的人类基因中随机抽取基因(250种) 统计单词出现频率的平均值 term1 term2 Term3 termn Gene1 Gene2 gene250 平均值 数据过滤 单词过滤的标准: 通过设定基准率(5%),去掉在全部科技文献中经常出现的单词 每一个单词在每一种基因上的出现率与基准率的差值〉25% 通过两个基因过滤的单词:一个单词只有在至少2个以上的基因中共现才在确定基因关系方面有用。 70个基因,25,000种单词,只保留下来101种。 可以调整单词过滤的阈值:下调阈值,增加了噪音,检索到更多的单词。 数据过滤 聚类分析 通过单词出现情况,给具有同样的文献分布特征的基

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档