生物数据整合与挖掘为复旦大学出版社出版发行.docVIP

生物数据整合与挖掘为复旦大学出版社出版发行.doc

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物数据整合与挖掘为复旦大学出版社出版发行.doc

《生物数据整合与挖掘》为复旦大学出版社出版发行。 《生物数据整合与挖掘》内容简介 : 生物信息学应用计算机技术对各种生物数据进行管理和分析,以期发现生物数据所反映的生物规律,促进生命科学的发展。一方面,生命科学实验产生的巨量的生物数据保存在世界各地的相关研究机构中,或隐含在浩瀚的科学文献里。这些数据反映了生命科学研究的整体进展和成果,有重叠更相互补充,这就需要将这些生物数据整合在一起。另一方面,生物信息学也希望采用数据挖掘技术对生物数据进行分析,以期发现生物规律,因此根据生命科学的需要和领域知识,设计出有效的生物数据挖掘算法和软件工具是一个重要的研究内容。 本书较为系统地介绍了生物数据整合与挖掘的技术框架,主要介绍了作者在这方面的研究成果,包括:生物数据抽取技术、生物数据整合技术、生物序列数据挖掘、基因表达谱芯片数据挖掘、转录因子及顺式调控元件挖掘、生物数据模型和数据库管理系统等内容,还介绍了一个生物数据整合系统、一个基因表达谱芯片数据库和数据挖掘系统、一个转录因子及顺式调控元件的挖掘分析平台等等的设计与实现。 本书的读者对象为从事生物信息学研究的科学工作者。本书也可以作为生物信息学专业研究生的教学参考书和生物软件工程技术人员的参考书。 《生物数据整合与挖掘》作者简介 : 朱扬勇,1963年生,浙江武义人。1994年于复旦大学获计算机软件专业理学博士学位。现为复旦大学计算机科学技术学院教授;上海市政府信息化专家;上海生物信息技术研究中心学术委员会委员;上海市计算机学会理事;上海市生物信息学会理事等。长期从事数据库、数据挖掘、生物信息等方面的研究,已发表论文100余篇,出版《数据库系统设计与开发》等教材5本。作为项目负责人,主持国家自然科学基金、“863计划”、上海市科委重点发展基金等10多项课题的研究工作。目前主要从事数据科学的研究,是该领域的主要倡导者。 目录 : 第1章 背景知识 1.1 生物信息学 1.1.1 基本概念 1.1.2 研究内容 1.1.3 研究方法 1.1.4 研究机构 1.2 数据整合 1.2.1 数据资源 1.2.2 数据整合的动因 1.2.3 数据整合的概念 1.2.4 数据整合的内容 1.3 数据挖掘 1.3.1 数据挖掘的定义 1.3.2 数据挖掘的任务 1.3.3 数据挖掘的类型 1.3.4 相关技术的差异 第2章 数据整合与数据挖掘方法 2.1 数据整合的方法 2.1.1 数据整合的方式 2.1.2 数据整合的步骤 2.2 数据挖掘的方法 2.2.1 数据挖掘过程示例 2.2.2 数据挖掘过程模型 2.2.3 数据挖掘应用方式 2.3 数据清洁技术 2.3.1 数据的质量问题 2.3.2 数据清洁的主要工作 2.4 数据仓库技术 2.4.1 数据仓库的概念 2.4.2 数据组织 2.4.3 主题设计 2.4.4 数据加载 2.4.5 数据规约 2.5 小结 第3章 生物数据源 3.1 生物数据 3.1.1 生物序列数据 3.1.2 生物分子结构数据 3.1.3 芯片及基因表达数据 3.1.4 生物网络数据 3.2 生物数据组织 3.2.1 生物数据的数据库组织形式 3.2.2 生物数据的互联网组织形式 3.3 生物数据库 3.3.1 生物序列数据库 3.3.2 基因组数据库 3.3.3 结构数据库 3.3.4 芯片和基因表达数据库 3.3.5 生物文献数据库 3.4 生物数据源的特征 3.5 小结 第4章 复杂生物数据源的数据抽取 4.1 生物数据抽取 4.1.1 生物数据抽取面临的问题 4.1.2 包装器的要素 4.1.3 抽取算法 4.1.4 元数据生成与包装器生成工具 4.2 包装器的设计 4.2.1 基于实例切分的抽取算法 4.2.2 基于定位器多结点共享的数据抽取模型 4.2.3 数据抽取模型描述 4.2.4 元数据的生成和维护 4.2.5 数据抽取模型表达能力 4.3 包装器解决方案 4.3.1 面向无噪声复杂数据源的解决方案 4.3.2 面向含噪声复杂数据源的解决方案 4.3.3 ReDE和L-树包装器生成工具的架构 4.3.4 ReDE和L-树包装器生成工具的实现技术 4.4 L-树匹配:面向复杂数据源的数据抽取算法 4.4.1 L-树上的数据映射机制 4.4.2 L-树匹配算法的相关概念 4.4.3 L-树匹配算法 4.4.4 L-树匹配算法举例 4.5 基于L-树的包装器生成工具 4.5.1 将ERE扩充成数据抽取脚本语言 4.5.2 可视化编辑调试环境 4.5.3 ERE的可视化构建 4.5.4 ERE的逻辑检查 4.5.5 抽取结果的可视化评价 4.5.6 以XML格式输出抽取结果 4.6 小结 第5章 生物数据整合案例 5.1 生物数据整合系统的设计 5.1.1 生

您可能关注的文档

文档评论(0)

cnsg + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档