- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于代理程序快速开发生物信息二次数据库.pdf
一170一 江苏农业科学2008年第2期
基于代理程序快速开发生物信息二次数据库
白云峰1,樊 磊1,包文斌2,陈国宏2
(1.江苏省农业科学院农业资源与环境研究所,江苏南京210014;2.扬州大学动物科技学院,江苏扬州225009)
摘要:以构建鸡基因组全序列二次数据库为例,探讨Windows操作系统下,编译Web代理程序,快速开发生
物信息二次数据库的一般过程。研究通用代理程序开发本地化生物信息二次数据库的具体步骤,所涉及的关键
技术以及常见问题解决。解决了海量生物信息自动下载与处理问题,经反复调试实现了示例程序鸡基因组全序
列二级数据库系统的快速构建。
关键词:代理程序;生物信息;数据库
中图分类号:Q754文献标志码:A 文章编号:1002—1302(2008)02—0170一02
生物信息学研究是涉及信息科学、控制科学、计
2基于Agent建立本地化生物信息二次数据库的
算机科学及分子生物学等多学科交叉领域。当前,
一般步骤
生物信息学主要研究热点集中于:大规模基因组测
序中信息分析;发现与鉴定新基因和新SNPs;完整 (1)采用网络编程技术,设计智能代理程序。
基因组的比较研究;大规模基因功能表达谱的分析; 以国际主流数据库GenBank数据信息为主要外部
生物大分子的结构分析和功能预测以及药物基因组
学与药物设计等领域¨。J。其中,处理海量生物信 源Web服务器的直接通信,解析查询字段,直接抓
息的数据库系统是开展上述研究工作的基础,尤其 取网络上的数据,从而大大节省时间。(2)代理程
是在后基因组时代,生物学家经常需要从公共数据 序以数据流方式将HTML页内容转换成字符文本,
库中有选择地抽取和整合数据,以建立面向特定研 结合正则表达式与字符串处理技术,析取具有生物
究领域和数据结构的数据库系统。通过智能代理程 学意义字段内容。(3)确立目标基因组二次数据库
结构,根据国内鸡基因组研究需求,参照GenBank
序(Agent)快速开发生物信息二级数据库是实现生
物信息海量异质数据整合的有效方法Ho。本研究 等国际主流通用数据库结构及数据交换通用格式,
以建立鸡基因组全序列二次数据库为实例,探讨 确立事实数据库的结构。(4)将字段数据映射写入
Windows操作系统.NET框架下,基于智能代理程序数据库中。对代理程序解析的结构,进行判断、分析
快速开发生物信息二级数据库的一般过程。 和整理,采用ADO.NET数据访问技术,将代理程序
解析出的文本数据,写入数据库中。下面以鸡基因
1系统开发环境
组数据为例对上述开发过程加以验证。
2003 Studi.
以Windows
Server操作系统,Visual
3鸡基因组本地化二次数据库系统设计
O.NETFrameWork Server
2005为开发平台,SQL
2000为后台数据支持。采用程序开发语言为.NET 系统以国际生物信息通用三大著名网站之一
Basic
框架下Visual2005来完成代理程序的编译与
调试。 序列为智能程序代理检索下载内容,作为子部分纳
人拟建立的“十一五”国家“863”课题中国地方鸡种
分子设计生物信息数据
原创力文档


文档评论(0)