- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2021年中国研究生数学建模竞赛D题
抗乳腺癌候选药物的优化建模
一、背景介绍
乳腺癌是目前世界上最常见,致死率较高的癌症之一。乳腺癌的发展与雌激
素受体密切相关,有研究发现,雌激素受体α亚型(Estrogenreceptorsalpha,ERα)
在不超过10%的正常乳腺上皮细胞中表达,但大约在50%-80%的乳腺肿瘤细胞
中表达;而对ERα基因缺失小鼠的实验结果表明,ERα确实在乳腺发育过程中
扮演了十分重要的角色。目前,抗激素治疗常用于ERα表达的乳腺癌患者,其
通过调节雌激素受体活性来控制体内雌激素水平。因此,ERα被认为是治疗乳腺
癌的重要靶标,能够拮抗ERα活性的化合物可能是治疗乳腺癌的候选药物。比
如,临床治疗乳腺癌的经典药物他莫昔芬和雷诺昔芬就是ERα拮抗剂。
目前,在药物研发中,为了节约时间和成本,通常采用建立化合物活性预测
模型的方法来筛选潜在活性化合物。具体做法是:针对与疾病相关的某个靶标(此
处为ERα),收集一系列作用于该靶标的化合物及其生物活性数据,然后以一系
列分子结构描述符作为自变量,化合物的生物活性值作为因变量,构建化合物的
定量结构-活性关系(QuantitativeStructure-ActivityRelationship,QSAR)模型,然
后使用该模型预测具有更好生物活性的新化合物分子,或者指导已有活性化合物
的结构优化。
一个化合物想要成为候选药物,除了需要具备良好的生物活性(此处指抗乳
腺癌活性)外,还需要在人体内具备良好的药代动力学性质和安全性,合称为
ADMET(Absorption吸收、Distribution分布、Metabolism代谢、Excretion排泄、
Toxicity毒性)性质。其中,ADME主要指化合物的药代动力学性质,描述了化
合物在生物体内的浓度随时间变化的规律,T主要指化合物可能在人体内产生的
毒副作用。一个化合物的活性再好,如果其ADMET性质不佳,比如很难被人体
吸收,或者体内代谢速度太快,或者具有某种毒性,那么其仍然难以成为药物,
因而还需要进行ADMET性质优化。为了方便建模,本试题仅考虑化合物的5种
ADMET性质,分别是:1)小肠上皮细胞渗透性(Caco-2),可度量化合物被人
体吸收的能力;2)细胞色素P450酶(CytochromeP450,CYP)3A4亚型(CYP3A4),
这是人体内的主要代谢酶,可度量化合物的代谢稳定性;3)化合物心脏安全性
评价(humanEther-a-go-goRelatedGene,hERG),可度量化合物的心脏毒性;4)
人体口服生物利用度(HumanOralBioavailability,HOB),可度量药物进入人体后
被吸收进入人体血液循环的药量比例;5)微核试验(Micronucleus,MN),是检
测化合物是否具有遗传毒性的一种方法。
二、数据集介绍及建模目标
本试题针对乳腺癌治疗靶标ERα,首先提供了1974个化合物对ERα的生物
活性数据。这些数据包含在文件“ERα_activity.xlsx”的training表(训练集)中。
training表包含3列,第一列提供了1974个化合物的结构式,用一维线性表达式
SMILES(SimplifiedMolecularInputLineEntrySystem)表示;第二列是化合物
对ERα的生物活性值(用IC表示,为实验测定值,单位是nM,值越小代表生
50
物活性越大,对抑制ERα活性越有效);第三列是将第二列IC值转化而得的
50
pIC(即IC值的负对数,该值通常与生物活性具有正相关性,即pIC值越大
505050
表明生物活性越高;实际QSAR建模中,一般采用pIC50来表示生物活性值)。
该文件另有一个test表(测试集),里面提供有50个化合物的S
您可能关注的文档
- 智能制造技术在化学工业中的应用.pdf
- 新版福建教育出版社信息技术五上册教案全.pdf
- 摩托车发动机活塞材料与性能考核试卷.pdf
- 探究《伤寒论》中芍药的应用规律概诉.pdf
- 掘进副队长岗位责任制.pdf
- 挤压车间考试题.pdf
- 指法练习课教学设计.pdf
- 拖拉机自动驾驶技术发展趋势考核试卷.pdf
- 拖拉机农事作业计划与调度考核试卷.pdf
- 拉链项目研究分析.pdf
- 17 功能位置-电气-final.xls
- 11其他总帐科目余额数据收集模板_v6.xls
- 09 设备-分析中心-final.xls
- 石油加工行业:特朗普新任期将会如何影响油价?.pdf
- 2025年度光伏设备行业策略报告:新技术推进利好龙头设备商,关注国内政策边际变化+装备出海.pdf
- 氢能与燃料电池行业研究:M1-10 FCV上险达5705辆,电解槽招标超GW.pdf
- 公用事业:能源结构绿色化进展及前景.pdf
- 轻工制造:以旧换新政策持续推进,关注家居估值修复.pdf
- 消费行业香江百货调改回顾与草根调研:湖南衡阳本土“胖东来”最新完整版本.pdf
- 海外十二大铜矿企业三季报汇总:海外企业铜矿供应增速较低.pdf
文档评论(0)