基于文本挖掘方法和组分向量方法构建骨质疏松症遗传相关基因网络-应用数学专业论文.docxVIP

基于文本挖掘方法和组分向量方法构建骨质疏松症遗传相关基因网络-应用数学专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
I I 摘 要 基于骨质疏松症的遗传相关基因构建复杂网络,总共构建 4 个网络。第一个 网络是利用 cytoscape 软件和插件 Agilent Literature search 进行文本挖掘构建 的。这个网络包含 872 个节点, 2149 个边。第二,三,四个网络,是基于前一种 挖掘出来的 872 基因名,在 NCBI 数据库中找出基因序列,搜索出 833 个基因 序列,再利用组分向量方法得到的。应用组分向量的方法把基因序列的符号序列 转化数值序列。由于基因序列的组成具有随机性,利用动力学语言模型去掉随机 性。这样得到的数值序列,再应用关联系数得到邻接矩阵,在此基础上构建出对 应不同字符串长度 k 的三个网络。在这四个网络中,节点度按照从大到小的顺序 排列,比较前 50 个,发现重复的次数最多的两个基因 btf 3l1, nog 与骨质疏松 症密切相关。这两个基因已有文献报道。 关键词:骨质疏松症;组分向量方法;动力学语言模型;邻接矩阵;节点度 I II Abstract In this paper,we constructed four networks for osteoporosis related gene. The first network was built by Cytoscape software and Agilent Literature search plugin. This network contains 872 nodes, 2149 edges. The other three networks were established by adjacent matrices obtained by composition vectors using dy- namical language approach. Among the above 872 genes, only 833 gene sequences could be downloaded from NCBI database using their gene names. For these four networks,we sort the genes (nodes)by their degrees. Then we take out the 50 genes with higher degrees in each network. Last we found two genes (btf3l1,nog) which are in the top 50 genes of all four networks. These two genes have been verified by literatures to be related to osteoporosis. Keywords:osteoporosis; composition vector; dynamics language model;adjacent matrix; node degree 目 录 第一章 绪 论 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1 生物信息学背景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1.1 生物信息学定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1.2 生物信息学研究的意义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 人类疾病和蛋白质组学的关系 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2.1 蛋白质组学 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2.2 疾病与蛋白质相互作用网络 . . . . . . . . . . . . .

您可能关注的文档

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档