- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
全球性的网络化、信息化进程正改变着人们的生活方式,技术应用以及电子商务的飞速增长给人们生活工作的各个层面带来了深刻的影响。 随着计算机与网络技术的迅猛发展,政府信息化越来越受到政府机关的重视,各地政府机关纷纷开始建立电子政务业务系统。 目前大多数政府机关已建立了大量的信息系统,例如档案管理系统、税务系统、工资系统、人事管理系统、系统、公共服务一卡通、资产管理系统等。 但众多业务应用系统相互独立,它们各自采用不同平台、不同数据库、不同编码,致使各业务系统之间的数据交换和信息资源共享存在困难,信息孤岛现象明显¨1]。 同时,众多的应用系统所带来的身份的认证和管理的复杂性既使得管理成本不能降低,又使得整个系统的安全性、可整合性降低,这已成为电子政务信息管理系统进一步发展的瓶颈所在。 因此,要想改变电子政务信息化水平的现状,整合信息资源,解决信息孤岛问题,就必须建立一个公共数据平台,它是在政府部门原有的各业务系统层面上搭建的一个高层应用平台,将各业务系统的异构数据集成应用,向下屏蔽各异构信息源异构性,向上提供数据集成基础服务,实现各种信息系统的互通互联和数据共享、数据的一致性,并在此基础上实现规范的信息管理。 近年来,随着语义的发展,其核心技术本体在数据集成方面得到了应用。 本体作为共享领域概念模型,可以通过定义领域内一致的术语和术语间的关系来描述异构信息源的语义信息,从而消除异构数据源的语义冲突。 在国外,对本体的研究较早,本体已经应用到各个领域。 相比国外,国内对本体的研究起步较晚,尤其是在电子政务方面,缺乏一致的本体模型,相关的应用也少。 目前,本体技术很少在电子政务信息化建设中应用,因此,如何把本体技术应用到电子政务异构数据管理集成中,采取何种策略进行构建,消除电子政务各信息系统异构数据库模式的语义冲突,从而解决电子政务中异构系统导致的信息孤岛问题,构建统一的数据平台,以便提高政府管理效率,就显得尤为重要。 1电子政务与本体11电子政务与本体概述电子政务是政府机构广泛深入地应用现代信息和通信技术,将政府内部和外部社会的责权与职能通过计算机网络硬件和软件技术进行集成、整合、优化、重组,做到跨越时间和空间,突破部门分割和传统组织、工作方法与工作流程的限制,力求全方位地、有效地施行与提供安全、高效、优质、规范和符合国际水准的管理与服务。 本体是为了某种目的描述世界时的一组抽象化概念,并且该组概念是得到广泛认可的、以规范化形式描述的。 根据定义描述本体时目的的不同,本体可以分为多种类型,依照领域依赖程度,可以细分为顶级—1、领域、任务和应用,这里研究的是领域本体,领域本体由属性、对象、关系和子领域本体组成。 引入本体的思想,借助本体对领域知识进行详细描述,以抽象出概念化的语义层次,为进一步研究语义化的信息交互提供了基本的语义层次2。 从形式上来说,本体由概念、关系、函数、公理和实例5种元素组成。 本体中的概念可以是一般意义上的概念,也可以是任务、功能、行为、策略推理过程等;关系表示概念之间的关联;函数则是一种特殊的关系;公理用于表示一些永真式;实例是指属于某种概念的基本元素,即某概念类所指的具体实例。 12本体在电子政务中的应用案例美国印第安纳州电子政府建设是很多文献介绍的典范,其成功之处在于利用本体方法建设电子政府数据库。 美国印第安纳州电子政府本体,属于最上层的域本体设计,它在家庭与社会服务这一本体下定义了9个本体即低收入、处于危险的儿童、精神病与吸毒、弱智、区域健康与人性化服务、医疗补助、政府机构、法律实施及财政,建立了最上层的概念关系,并用图形和箭头形式标示出了各下层本体之间的关系以及在一个专业本体里所包括的术语。 13电子政务中本体的核心概念及抽取方法目前,大多数本体学习方法和本体学习系统都是直接将术语识别为概念。 术语的抽取被认为是进行本体自动构建的关键。 针对术语抽取的研究主要有基于语法规则的方法、基于统计的方法、—系统法。 利用语法规则的方法来进行术语抽取具有提取术语准确度较高、处理过程简单、计算量较小、能够有效提取低频术语等多项优点。 但是,由于语言学规则本身难以掌握,尤其是针对开放性的语料,语言学的规则更是难以准确应用,利用人工来研究语言学的规律越来越难以实现;使用统计的方法来抽取术语可以高效地识别领域术语,只要一个词在文本集中出现的频率高,就可以被有效抽取出来,可移植性较好。 但是,这种方法计算量大,在处理低频术语的时候,效果较差;—系统法主要采用系统对内容进行分词处理,然后对分词进行抽取处理,这样抽取的优点是抽取内容比较全面,但效率比较低,并且需要人工手动处理。
文档评论(0)