- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2025年大学《生物信息学、生物数据库原理》考试备考试题及答案解析
一、单项选择题(每题2分,共20分)
1.以下哪类数据库属于二次生物数据库?
A.GenBank(核酸序列)
B.UniProt(蛋白质序列)
C.KEGG(代谢通路)
D.PDB(蛋白质结构)
答案:C
解析:一次数据库直接存储原始实验数据(如GenBank的DNA序列、UniProt的蛋白质序列、PDB的三维结构坐标),二次数据库通过整合、注释或关联一次数据形成功能化信息(如KEGG整合代谢通路、基因功能等信息)。
2.下列关于BLAST算法的描述,错误的是?
A.采用启发式搜索策略提高速度
B.优先寻找短长度的高匹配片段(种子)
C.适用于全局序列比对
D.E值越小表示匹配结果越可靠
答案:C
解析:BLAST(BasicLocalAlignmentSearchTool)是局部比对工具,用于寻找序列中的局部相似区域;全局比对通常使用Needleman-Wunsch算法。
3.构建生物数据库时,数据标准化的核心目的是?
A.减少存储空间占用
B.确保不同来源数据的可整合性
C.提高数据查询速度
D.满足用户界面美观需求
答案:B
解析:生物数据来源多样(如高通量测序、质谱、文献),标准化(如使用统一标识符、遵循国际格式标准)是实现跨数据库检索和分析的基础。
4.在蛋白质结构预测中,同源建模法的关键前提是?
A.目标蛋白与已知结构蛋白有相同功能
B.目标蛋白与已知结构蛋白序列相似度≥30%
C.目标蛋白的晶体衍射数据已获取
D.目标蛋白属于膜蛋白家族
答案:B
解析:同源建模依赖已知结构的同源蛋白(通常序列相似度30%)作为模板,通过序列比对构建目标蛋白的三维结构模型。
5.以下哪种数据不属于生物数据库的典型存储对象?
A.单细胞RNA测序的表达矩阵
B.临床样本的病理图像
C.文献中的基因功能描述
D.实验室设备的采购记录
答案:D
解析:生物数据库聚焦生物相关数据(分子序列、组学数据、功能注释、实验结果等),实验室设备记录属于管理类数据,通常不纳入生物数据库核心存储范畴。
6.关于FASTA格式的描述,正确的是?
A.第一行以“”开头,包含序列标识符和描述
B.仅支持DNA序列存储,不支持蛋白质序列
C.必须使用双字节编码保存
D.序列部分可以包含空格分隔
答案:A
解析:FASTA格式第一行以“”起始(如gi|12345|emb|X12345.1|),后续行为连续的序列字符(DNA/RNA用A/T/C/G/U,蛋白质用单字母氨基酸代码),无空格或特殊符号。
7.在基因组注释中,CDS(编码序列)的识别主要依赖?
A.GC含量分析
B.开放阅读框(ORF)预测
C.启动子区域甲基化水平
D.非编码RNA的二级结构
答案:B
解析:CDS是mRNA中编码蛋白质的部分,其识别需找到起始密码子(ATG)到终止密码子(TAA/TAG/TGA)的连续ORF,排除内含子干扰。
8.生物数据库设计中,ER模型(实体-关系模型)的主要作用是?
A.优化数据库查询语句性能
B.描述数据实体间的关联关系
C.压缩存储大文件(如BAM格式)
D.实现数据的加密传输
答案:B
解析:ER模型通过实体(如“基因”“样本”)、属性(如基因ID、长度)和关系(如“基因-样本”的表达量关联)可视化数据库的逻辑结构,是概念设计阶段的关键工具。
9.下列哪项技术常用于生物数据的质量控制?
A.主成分分析(PCA)降维
B.碱基错误率(Q值)计算
C.系统发育树构建
D.分子动力学模拟
答案:B
解析:测序数据质量控制中,Q值(Phred质量分数)表示碱基正确的概率(如Q30表示错误率为0.1%),是评估数据可靠性的核心指标。
10.在代谢通路数据库(如Reactome)中,“反应”实体通常关联的信息不包括?
A.参与的酶(EC编号)
B.底物与产物的化学结构
C.细胞亚定位(如线粒体)
D.实验论文的DOI编号
答案:D
解析:代谢通路数据库聚焦反应的生物学过程(酶、底物、定位),实验论文的引用信息通常存储在文献数据库(如PubMed)或单独的“引用”表中。
二、填空题(每空1分,共15分)
1.国际三大核酸序列数据库协作组织包括______、______和DDBJ(日本DNA数据库)。
答案:GenBank(美国)、ENA(欧洲核酸数据库)
2.蛋白质结构数据库PDB中,结构解析方法主要包括X射线晶体学、______和______。
答案:核磁共振(NMR)、冷冻电镜(Cryo-EM)
3.生物信息学中,常用______
您可能关注的文档
最近下载
- 2022-2023学年二年级语文上册期末乐考 非纸笔测试题(四) 部编版(含答案).docx VIP
- 2025年秋期人教版六年级上册数学全册核心素养教案(教学反思有内容+二次备课版).pdf
- 23DX001建筑电气工程设计常用图形和文字符号- 2.1.5 下.pdf VIP
- 2022-2023学年二年级语文上册期末乐考 非纸笔测试题(一) 部编版.docx VIP
- 七年级上册地理知识点.doc VIP
- 22K505医院洁净用房通风空调设计与安装.docx VIP
- 嵌入式软件工程师招聘条件.pdf VIP
- 高级英语(第四版)1_教学课件Lesson 11 Speech on Hitler’s Invasion of the U.S.S.R..ppt VIP
- 《大学生就业指导》PPT课件ppt.pptx VIP
- 2022-2023学年二年级语文上册期末乐考+非纸笔测试题(二)+部编版.docx VIP
原创力文档


文档评论(0)