化学文献数据库的网络应用及化学物质名称自动识别的研究.pdfVIP

化学文献数据库的网络应用及化学物质名称自动识别的研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优秀博硕毕业论文,完美PDF内部资料。支持编辑复制,值得参考!!!

引 言 摘要 数据库的网络应用是一项应用较为广泛的技术,它可以消除数据应用地域性的差异,最大效应 的发挥数据库的作用。但是,如何提高数据库的检索效率、以及如何实现相关数据库的数据交流是 摆在数据库应用中的一个重要的问题。其中数据库间的数据交互是提高数据库应用效果的核心问题, 也是数据库应用的发展方向。本文以化学文献数据库的网络应用为例详细的介绍了数据库网络应用 中提高检索效率的方法,同时为了实现化学文献数据库同其他相关化学数据库的数据交流功能,本 文还着重对化学文献数据库化学物质名称的自动识别技术进行了研究和探讨。 本文首先从化学文献数据库的应用背景以及用户的需求谈起,指出化学文献数据库的网络应用 能够更加有效的发挥其化学领域巨大的参考、应用价值;同时指出如果能够实现化学文献数据库的 检索结果同相关化学数据库的信息进行交流,将能够大大方便用户的使用以及提高数据库价值,而 这二者也正是单机版化学文献数据库应用中的不足。 本文在论述化学文献数据库的设计中分析了各种应用方案选择的依据,提出了能够适应化学文 献数据库的应用,并能够提高开发的效率以及降低维护难度的应用方案。在数据库设计中本文还讨 论了关于数据库元数据建立的问题,指出元数据的建立是实现数据集成、数据库二次开发和利用的 关键,数据库元数据的建立是网络数据库应用中不可缺少的一步。 本文在化学文献数据库的应用部分中,详细的介绍了数据库检索所采用的技术,以及优化的方 法。检索是数据库应用中最为重要、关键的部分,考虑到化学文献数据库用户的需求,在检索中采 用支持组合检索的技术——即采用逆波兰的检索技术来实现。在逆波兰检索应用中,本文讨论了一 种新的用来处理逆波兰检索表达式的方法,以降低网络应用时系统的开销;在对数据库检索处理中, 本文探讨了提高大数据量(百万级)检索速度的方法——全文索引和簇索引技术,并对比了全文检 索方法同常规检索方法的效率,提出全文索引的优化方法。 本文还探讨了如何实现数据库间信息的交互这一数据库应用中的重要问题。要实现化学文献数 据库的检索结果同相关化学数据库信息的交互,需要有一个数据库间的参照表,而在化学领域,这 个参照表的内容就应该是化学物质名称。因此,为了实现数据库间的信息交互,必须将化学文献数 据库中的化学物质名称标识出来,而采用人工的方法显然是不可取的。这里本文用较大的篇幅探讨 了化学文献数据库化学物质名称自动识别技术的方法和应用。 化学物质名称的自动识别技术实际上是自动抽词技术在化学领域中的应用。本文首先从化学家 进行人工识别化学物质名称的方法入手,得出基本规律,同时研究了化学名词的构词法,结合两方 面的特点,探讨出应用计算机技术对化学物质名称自动识别的可行性以及实现的基本方法;接着, 讨论了应用自动抽词技术的前提条件——抽词词典的建立。因为,抽词词典的完善以及准确与否, 是实现自动识别的关键。本文详细的介绍了抽词词典中数据的获得以及词典建立的方法和过程;随 后,探讨了化学物质名称自动识别技术的算法——单个化学名词的自动识别算法以及实现可跨越的 识别算法;本部分还探讨了关于自动识别技术的自学习功能,使得自动识别能够不断的更新。 最后,本文进行了化学文献数据库的网络应用情况、自动识别功能和自学习方法的演示。 关键词:化学文献数据库,数据库检索,全文检索,自动抽词,自学习 2 引 言 Abstract The database network application is a very important technology, which can avoid the regional difference of data, and let database be more efficient. How to improve the retrieval efficiency and how to realize the communication among related databases are t

文档评论(0)

文献大师 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档