- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(19)中华人民共和国国家知识产权局
(12)发明专利
(10)授权公告号 CN 107688727 B
(45)授权公告日
2020.07.14
(21)申请号 201610639522.5 审查员 王青
(22)申请日 2016.08.05
(65)同一申请的已公布的文献号
申请公布号 CN 107688727 A
(43)申请公布日 2018.02.13
(73)专利权人 深圳华大基因股份有限公司
地址 518083 广东省深圳市盐田区洪安三
街21号华大综合园7栋7层-14层
(72)发明人 石卓兴 袁永娴 杨林峰
(74)专利代理机构 深圳鼎合诚知识产权代理有
限公司 44281
代理人 孙银行 彭家恩
(51)Int.Cl.
G16B 30/00(2019.01)
G16B 40/00(2019.01) 权利要求书1页 说明书8页 附图3页
(54)发明名称
生物序列聚类和全长转录组中转录本亚型
识别方法和装置
(57)摘要
本发明公开了一种生物序列聚类和全长转
录组测序数据中转录本亚型识别的方法和装置,
其中生物序列聚类方法,包括:提供待聚类的生
物序列;将所述生物序列比对到参考序列,得到
结果文件;按照设定的聚类标准对所述结果文件
进行聚类。本发明的生物序列聚类方法,在进行
序列相似度计算时加入参考序列信息,能够有效
降低计算复杂度,具有快速、准确的特点。
B
7
2
7
8
8
6
7
0
1
N
C
CN 107688727 B 权 利 要 求 书 1/1页
1.一种基于参考序列的全长转录组测序数据中转录本亚型识别的方法,其特征在于,
所述方法包括:
提供全长转录本序列;
将所述全长转录本序列比对到参考序列,得到结果文件;
对所述结果文件的序列进行比较外显子结构以及比较每个外显子的5’端和3’端坐标,
并且按照设定的标准定义转录本亚型击中;
根据所述转录本亚型击中对所述结果文件的序列标记分组;
将各组内的所有序列构建成一条转录本亚型的一致性序列。
2.根据权利要求1所述的转录本亚型识别的方法,其特征在于,所述方法还包括:将所
述结果文件按照设定的标准分成子文件;相应地,对所述子文件的序列进行比较外显子结
构以及比较每个外显子的5’端和3’端坐标,并且按照设定的标准定义转录本亚型击中;根
据所述转录本亚型击中对所述子文件的序列标记分组;将各组内的所有序列构建成一条转
录本亚型。
3.根据权利要求1或2所述的转录本亚型识别的方法,其特征在于,所述外显子结构包
括外显子个数以及排列组合方式;所述设定的标准包括:如果两条序列的外显子结构一致,
除起始和终止外显子之外的各个外显子容许3bp的错位,则定义为转录本亚型击中。
4.根据权利要求1或2所述的转录本亚型识别的方法,其特征在于,所述外显子结构包
括外显子个数以及排列组合方式;所述设定的标准包括:如果两条序列的外显子结构一致,
并且对转录本的5’端容错第一预定长度,3’端容错第二预定长度,则定义为转录本亚型击
中。
5.根据权利要求1或2所述的转录本亚型识别的方法,其特征在于,所述根据所述转录
本亚型击中对所述结果文件的序列标记分组,具体通过基于表搜寻算法的处理来实现。
6.一种基于参考序列的全长转录组测序数据中转录本亚型识别的装置,其特征在于,
所述装置包括:
输入单元,用于提供全长转录本序列;
比对单元,用于将所述全长转录本序列比对到参考序列,得到结果文件;
定
文档评论(0)