- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种抽取并组织网路上基因相关资料的方法asystem-陈钟诚的网站
一種抽取並組織網路上基因相關資料的方法一種抽取並組織網路上基因相關資料的方法
一種抽取並組織網路上基因相關資料的方法一種抽取並組織網路上基因相關資料的方法
作者 : 陳鍾誠 作者 : 高成炎
地址 : 臺北市羅斯福路 4段一號 地址 : 臺北市羅斯福路 4段一號
台灣大學資訊工程所 台灣大學資訊工程所
電話 : 0938707315 電話 : (02) 509
服務機關 : 台灣大學資訊工程研究所 服務機關 : 台灣大學資訊工程研究所
E-mail : johnson@.tw E-mail : cykao@.tw
專長 : XML 全文檢索、自然語言處理專長 : 生物資訊學
學歷 : 台灣大學資訊工程研究所博士 學歷 : 美國威斯康辛大學 ﹙麥迪生校
區﹚計算機科學 博士
中文摘要中文摘要
中文摘要中文摘要
生物基因的相關資料目前大都可由全球資訊網上取得 ,例如、美國國家衛生研究
院的生物科技資訊中心 (NCBI)就儲存了大量的基因相關資料 ,這些資料會透過
網頁形式被輸 出到網路上,使用者可利用瀏覽器來閱讀這些資料,然而這些資料
常常散落在各個網頁輸出介面上 ,無法有效整合成單一的資料倉儲,導致許多研
究者使用者無法有效的查詢出想要的資料 ,本論文提出一個基於欄位填充機制的
資料整合架構 ,該架構可以由網路上抓取想要的網頁,並將這些網頁整合為單一
的知識架構以便瀏覽與查詢 ,以方便生物研究者進行研究。
關鍵字關鍵字
關鍵字關鍵字
資訊抽取 、資料整合、樣稿、知識架構、生物資訊、基因
A system integrates data about gene on Web into ontology
Chung Chen Chen Cheng Yan Kao
johnson@.tw cykao@.tw
Dept. of Computer Science and Information Engineering
National Taiwan University, Taiwan
Abstract
The data about gene are distributed stored in several database on Internet. For example,
National Center for Biotechnology Information (NCBI) collects several large-scale data
sources about gene, each data source was exported to Web by an query interface.
However, researchers on biology need an integrated data-warehouse instead of several
data sources. In this paper, we propose a method to integrate several data sources into a
data warehouse based on a frame-based ontology framework. A slot-filling mechanism
based on the framework is developed to extract data from web pages and then organized
into frames. These data are store
文档评论(0)