基因聚类方法和基于该方法的宏基因组组装方法和装置发明专利.pdfVIP

基因聚类方法和基于该方法的宏基因组组装方法和装置发明专利.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 108133122 A (43)申请公布日 2018.06.08 (21)申请号 201611090611.5 (22)申请日 2016.12.01 (71)申请人 深圳华大基因股份有限公司 地址 518083 广东省深圳市盐田区洪安三 街21号华大综合园7栋7层-14层 (72)发明人 覃友文 高强 梁文颖 张义  杨林峰  (74)专利代理机构 深圳鼎合诚知识产权代理有 限公司 44281 代理人 孙银行 彭家恩 (51)Int.Cl. G06F 19/24(2011.01) 权利要求书2页 说明书8页 附图3页 (54)发明名称 基因聚类方法和基于该方法的宏基因组组 装方法和装置 (57)摘要 本发明公开了一种基因聚类方法和基于该 方法的宏基因组组装方法和装置,所述基因聚类 方法包括:根据每个基因序列或小基因簇在多个 样品中的丰度谱,以及每个大基因簇在多个样品 中的丰度谱,通过多元线性回归,计算每个大基 因簇与每个基因序列或小基因簇的相关性;找到 与每个大基因簇的相关性大于设定值的基因序 列或小基因簇,并将所找到的基因序列或小基因 簇合并至相关联的大基因簇中,组合成新的大基 因簇。能够找到多个基因序列或小基因簇的多个 源头大基因簇,弥补现有方法的不足,从而增加 A 基因簇的大小,并且获得更好的基因组草图。 2 2 1 3 3 1 8 0 1 N C CN 108133122 A 权 利 要 求 书 1/2 页 1.一种基因聚类方法,其特征在于,所述方法用于将多个基因序列或小基因簇聚类到 多个大基因簇中,其中所述基因簇是指一组有相同来源的基因集合,所述小基因簇是指基 因数量小于预设值的基因集合,所述大基因簇是指基因数量大于所述预设值的基因集合; 所述方法包括: 根据每个所述基因序列或小基因簇在多个样品中的丰度谱,以及每个所述大基因簇在 所述多个样品中的丰度谱,通过多元线性回归,计算每个所述大基因簇与每个所述基因序 列或小基因簇的相关性; 找到与每个所述大基因簇的相关性大于设定值的基因序列或小基因簇,并将所找到的 基因序列或小基因簇合并至相关联的大基因簇中,组合成新的大基因簇。 2.根据权利要求1所述的基因聚类方法,其特征在于,所述方法中的多元线性回归依据 如下方程式进行: 其中,E 表示基因序列或小基因簇j在样品i中的相对丰度,a 表示大基因簇k在样品i ij ik 中的相对丰度,e 表示基因序列或小基因簇j与大基因簇k的相关性。 kj 3.根据权利要求2所述的基因聚类方法,其特征在于,所述方法还包括使用系数收缩技 术计算出所述相关性e 。 kj 4.根据权利要求3所述的基因聚类方法,其特征在于,所述小基因簇是相似丰度谱基因 簇,所述大基因簇是宏基因组物种基因组,所述系数收缩技术是LASSO收缩方法,所述相关 性的设定值为0.1。 5.一种基因聚类装置,其特征在于,所述装置用于将多个基因序列或小基因簇聚类到 多个大基因簇中,其中所述基因簇是指一组有相同来源的基因集合,所述小基因簇是指基 因数量小于预设值的基因集合,所述大基因簇是指基因数量大于所述预设值的基因集合; 所述装置包括: 相关性计算单元,用于根据每个所述基因序列或小基因

文档评论(0)

哒哒 + 关注
实名认证
文档贡献者

哒哒

1亿VIP精品文档

相关文档