- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物医学课题研究论文(五篇)
内容提要:
1、生物医学文本挖掘研究热点2、生物医学科研伦理审查研究3、生物医学计算平台管理和运行维护4、生物医学工程专业实验课教学方法5、红足壮异蝽的生物学特性与防治研究
全文总字数:19928 字
篇一:生物医学文本挖掘研究热点
生物医学文本挖掘研究热点
[摘要]为了解生物医学文本挖掘的研究现状和评估未来的发展方向,以美国国立图书馆PubMed中收录的2000年1月-2015年3月发表的生物医学文本挖掘研究文献记录为样本来源,提取文献记录的主要主题词进行频次统计后截取高频主题词,形成高频主题词-论文矩阵,根据高频主题词在同一篇论文中的共现情况对其进行聚类分析,根据高频主题词聚类分析结果和对应的类标签文献,分析当前生物医学文本挖掘研究的热点。结果显示,当前文本挖掘在生物医学领域应用的主要研究热点为文本挖掘的基本技术研究、文本挖掘在生物信息学领域里的应用、文本挖掘在药物相关事实抽取中的应用3个方面。
[关键词]文本挖掘;生物医学研究;研究热点
随着生物医学科学的飞速发展,生物医学领域的实验数据和文献数量急剧增加。常用的检索方式通常会消耗大量时间,并且需要对检索词进行仔细筛选及恰当组合。文本挖掘是通过计算机发现以前未知的新信息,即在现有文献资源中自动提取相关信息,并揭示另外隐含的意义[1]。利用文本挖掘能够有效地从生物医学数据库中提取相关知识进行研究进而提出新的实验假设,得到新的科学结论,因此文本挖掘在生物科学领域具有很大的应用价值。以检索词“textmining”在PubMed检索(2015年6月9日)相关文献,结果显示文献累积数量随着年代的分布呈现典型的指数分布,说明文本挖掘在生物医学领域中正处在飞速发展中,是当前的研究热点。基于以上原因,我们运用共词分析的方法,对2000年1月至2015年3月MEDLINE数据库收录的有关文本挖掘在生物医学领域应用的论文中的高频主题词进行了共现聚类分析,总结出当前国际上文本挖掘在生物医学领域应用的研究热点,并对其进行分析。
1资料与方法
数据样本为MEDLINE数据库收录的生物医学领域文本挖掘研究文献。MEDLINE是国际上生物医学领域的权威数据库,迄今收录文献达2400万篇,通过该数据库可以检测到含有确切关键词的文献[2]。采用检索策略为:“textmining”[tiab]AND((“2000/01/01”[PDAT]:“2015/03/31”[PDAT])ANDmedline[sb]),共得到879篇相关文献记录。以xml格式将全部相关文献记录套录下来,运用文献计量学统计分析软件BICOMB[3]抽取和统计以上文献中的主要主题词及副主题词及每个词在以上全部文献中的出现频次,按照它们的出现频次由高到低进行排序,选取其中出现频次高于13次的40个主题词/副主题词作为高频主题词(表1)。由于这些文献的篇名或摘要中含有“文本挖掘”被检出,且被收录于MEDLINE,其主要内容都与生物医学文本挖掘有关,因此得到的主题词和副主题词可反映文本挖掘在生物医学领域中的应用情况。对所有高频主题词做进一步处理,统计每一个高频词在文献中的出现情况,形成高频词-文献矩阵,输入到gCLUTO软件,采用系统聚类法对所得相似矩阵进行聚类分析,聚类分析的结果可以反映出这些高频词之间的亲疏关系,分析这些高频主题词能够获得生物医学领域文本挖掘研究的热点。聚类结果如图1所示,其中横轴代表PubMed数据库中文献,纵轴代表进行聚类的主题词/副主题词。如果两词聚集到一起的距离短,说明它们的关系越密切[4]。首先,根据每一类高频主题词的含义以及这些主题词之间的语义关系,总结出每一类主题词所代表的研究热点,即当前医学领域文本挖掘研究的热点。例如,主题词NaturalLanguageProcessing(自然语言处理)和PeriodicalsasTopic(期刊作为主题)距离较近,关系密切,首先聚成一类;ArtificialIntelli-gence(人工智能)再与前面两个词合成一类,这一类再与MEDLINE组成的一类再聚成一大类,以此类推。通过分析这些主题词的语义关系就能得出它们所代表的类团含义标签,综合各个类别的类标签可以得出当前医学领域文本挖掘研究的热点。其次,利用gCLUTO软件计算各类成员对聚类贡献率的指标(描述度Descriptive和区分度Descriminating),选取对每一类形成贡献最大的来源文献作为表示该类内容的类标签文献,通过文献内容进一步阐释该研究方向的具体内容。
2结果与分析
通过对近2000-2015年MEDLINE收录的生物医学领域文本挖掘研究文献的高频主题词和副主题词进行共现聚类分析(图1),我们将该领域的研究热点分为以下3大方面,14个主题。
2.1文本挖掘
您可能关注的文档
- 水利经济课题研究论文(五篇):基层水利工程建设管理发展思路分析、谈水利工程施工堤坝防渗加固技术….doc
- 施工工艺课题研究论文(五篇):公路水泥碎石基层施工工艺及质量、外浮顶储罐防腐施工工艺分析….doc
- 水利施工课题研究论文(五篇):水利施工混凝土裂缝原因及防治措施探讨、谈水利工程竣工结算审核….doc
- 石油工程课题研究论文(五篇):石油工程中新型采油技术的运用、如何实现海洋石油工程项目进度的管理….doc
- 通信技术课题研究论文(五篇):5G移动通信技术下的物联网时代、5G移动通信技术应用及发展前景….doc
- 文化艺术课题研究论文(五篇):传统文化艺术在现代包装中应用、乾务民间文化艺术推向全国探析….doc
- 文化产业课题研究论文(五篇):数字化赋能文化产业高质量发展探析、理想国对高校文化产业管理教育探索….doc
- 实体经济课题研究论文(五篇):电子商务与实体经济融合发展、我国实体经济转型路径探讨….doc
- 软件工程课题研究论文(五篇):软件工程实践类的课程体系、案例驱动法的软件工程课程影响因素….doc
- 民族音乐课题研究论文(五篇):民族音乐采茶歌作曲及音乐史的关系、民族音乐文化和茶文化之间互通性探讨….doc
- 税务风险课题研究论文(五篇):建筑企业税务风险及纳税筹划、污水处理企业税务风险管理探讨….doc
- 室内设计课题研究论文(五篇):在室内设计中应用低碳理念、在室内设计中应用黑白灰的思考….doc
- 平面设计课题研究论文(五篇):汉字在平面设计中的运用优势分析、民俗文化在平面设计中的传承和创新….doc
- 企业管理课题研究论文(五篇):企业管理中的工商管理实施应用、企业管理会计应用与创新….doc
- 通信技术课题研究论文(五篇):医疗卫生中网络和通信技术的应用、LTE无线通信技术与物联网技术结合分析….doc
- 社会实践课题研究论文(五篇):大学生社会实践基地建设的构建、大学生三下乡暑期社会实践研究….doc
- 内科医学课题研究论文(五篇):结肠癌医治问题研究、免疫医治问题研究….doc
- 人力资源课题研究论文(五篇):电力企业中人力资源培育分析、人力资源在企业中的合理配置与管理….doc
- 石油工程课题研究论文(五篇):谈海洋石油工程项目管理、海洋石油工程石油机械的应用分析….doc
- 外语教学课题研究论文(五篇):多媒体教学建设和高校外语教学的结合、行动研究中外语教学实施的困境….doc
文档评论(0)