- 2
- 0
- 约9.17千字
- 约 9页
- 2025-08-09 发布于山东
- 举报
榴莲99份种质资源变异位点数据集
榴莲(DuriozibethinusMurr.)是木棉科榴莲属热带果树,果实气味浓烈,味道独特,被誉为“水果之王”[。榴莲富含蛋白质、脂类和氨基酸,是良好的果品类营养来源,具有很好的保健功能[2-3]。榴莲原产于婆罗洲、苏门答腊等地,400年前被引种到印度至新几内亚的广袤地区,现为泰国、马来西亚、印度尼西亚、菲律宾、越南和缅甸等东南亚诸国广为种植。
我国是重要的榴莲进口国和消费国,榴莲产业在我国潜力很大[4]。近年来,随着社会经济水平不断提高,我国鲜榴莲进口量逐年增加,2023年进口量为142.59万吨,进口额达67.16亿美元[5]。榴莲的国产化种植有助于减轻进口依赖,可为乡村产业振兴带来重要的社会效益和经济效益。除台湾省外,海南省是我国唯一引种榴莲成功的省份[]。榴莲生长需要年均温度22°以上、年降雨量1000毫米以上的气候条件,海南省北纬19°以南的三亚、乐东、保亭和陵水等市县较适宜榴莲种植[]。海南省榴莲产业处于刚刚起步阶段,品种缺乏自主性,存在面积小、产量低、配套栽培技术欠缺等诸多问题,市场需求与产业薄弱矛盾突出。要发展海南榴莲产业,首先要大力引进榴莲种质资源,开展精准鉴定和评价。本研究对越南、泰国、马来西亚引进及自主创制的99份榴莲种质资源开展了二代全基因组测序,进行了变异位点挖掘和群体进化分析,为榴莲育种方法和育种理论研究提供了基础数据支撑,有助于榴莲自主优秀品种选育。
2数据采集与处理方法
本研究所用榴莲种质资源共计99份,于2024年2月一3月采自海南省三亚,选取新梢幼嫩叶片,于-75°C超低温冰箱中保存备用。样品名称、采样地点、来源和特征如表1所示。
2.2DNA提取
采用CTAB法进行DNA提取,用超纯水稀释至50ng/μl,-20°C保存备用。
2.3文库构建与测序
每个样品使用0.2μg的DNA作为文库制备的输入材料。根据RapidPlusDNALibPrepKitforIlumina(RK20208)试剂盒说明书的要求,将基因组DNA样品通过超声波打断至350bp大小。然后对DNA片段进行末端修饰、A尾加尾,并与Illumina测序的全长接头连接,随后进行PCR扩增。PCR产物通过AMPureXP系统(BeckmanCoulter,Beverly,美国)纯化后,使用Qubit3.0荧光计(Invitrogen,美国)测量DNA浓度,文库通过Agilent2100生物分析仪分析大小分布,并通过实时PCR定量(204)。索引编码样品的聚类在cBotClusterGenerationSystem上使用IlluminaPEClusterKit(Illumina,美国)按照说明书进行。聚类生成后,DNA文库在IlluminaHiSeqXTen平台上进行测序,生成150bp的双端读长(paired-endreads)。下机数据已经提交到国家基因组数据中心(NGDC),检索号:PRJCA027184和PRJCA026560。测序数据量共计约1.62Tb,平均每份资源测序数据量15.6Gb。
2.4测序数据比对与变异位点挖掘和注释
采用fastp软件[8使用默认参数对下机数据进行过滤,得到的cleanreads以‘干尧’榴莲基因组序列hapl.chromosome.fasta(https:///10.57760/sciencedb.agriculture.00013)为参考序列文件进行比对,使用软件为bwa-mem,使用samtoolsflagstat命令[9]对比对情况进行统计。之后,用samtoolssort命令对bam文件进行排序,用gatkMarkDuplicates命令[10]对PCR重复序列进行标记。再用gatkHaplotypeCaller命令对每一个样品进行独立的变异位点挖掘,并用gatkCombineGVCFs命令将99个样品的gvcf文件进行合并,使用gatkGenotypeGVCFs命令得到vcf文件。变异位点注释使用snpEff软件[11],参考注释文件为hapl.gene_annotation.gff3(https:///1o.57760/sciencedb.agriculture.0oo13)。
2.5群体进化分析
使用plink2软件[12]对vcf文件进行过滤,参数为--mind0.10--maf0.05--geno0.05--hwe0.0001--recodevcfid-paste=iid--allow-extra-chr--set-missing-var-ids@:#--indep-pairwise50100.2,并使用vcf2phylip.py脚本生成ph
原创力文档

文档评论(0)