- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
 - 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
 - 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
 - 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
 - 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
 - 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
 - 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
 
                        查看更多
                        
                    
                一种面向服务Mashup的推荐方法研究.doc
                      一种面向服务Mashup的推荐方法研究
1引言
1.1论文背景及研究意义
随着互联网技术的发展和普及,越来越多的组织和机构通过互联网对外发布数据,使当今互联网上可用的数据资源剧增。在电子商务、城市应急、科学计算等诸多领域,业务用户通常需要快速集成互联网上各种结构的数据资源,以满足其即时、个性化的数据需求。因此,如何有效的管理和共享数据,实现企业间的跨域数据集成和共享,是企业提升自身管理水平和竞争力的必要手段。然而,由于不同类型数据源存在异构性、分布性和自治性⑴,如何根据需要有效的集成数据仍然面临着一些困难。首先,互联网上的数据资源类型十分多样化,不仅包括传统的企业数据库中存储的关系型数据,还包括以XML、HTML等结构化和半结构化的数据,还有以ashup使得用户以统一方式访问及操作各种异构的数据,但是由于Mashup操作复杂、数据服务种类众多等原因使得用户通过构造数据服务Mashup进行数据集成仍有许多不便。为了更加具体的叙述本文要解决的实际问题,本章节以刑事侦查领域中公安人员抓捕嫌疑人场景为例,介绍普通用户在构建数据服务Mashup过程中遇到的困难以及服务推荐方法应如何帮助用户选择合适的数据服务以及Mashup模式、解决用户困难。案情简介:警察来到发现受害人地点(第一现场)并确认被害人身份。警察发现受害人被害场地(第二现场)并不是第一现场且两个场地距离较远,因此判定犯罪嫌疑人在杀害受害人后使用车辆将其转移。案件的初始信息十分简单,为了发现更多有用线索,办案人员的传统做法是走访各个信息部门包括当地派出所、运营商办公地点等,通过查阅档案或者根据常年积累的直觉经验,判断该事件中信息之间的关联然后挖掘有用的信息。随着社会各个部门信息系统的逐渐完善,公安干警可以从各类信息查询系统、视频监控系统中查找案件线索,如从社交软件中获得用户的好友信息、从通信运营商的业务系统中获得通过记录等。但是各个信息系统都有不同的数据访问形式,并且各个信息系统管理人员对外公开的数据和数据模式有安全方面的顾虑。而数据服务Mashup技术可以使各个信息系统向公安平台幵放自己的数据访问接口(数据服务),方便用户使用的同时又保护数据安全性。公安干警可以通过构建数据服务Mashup方便的从各个信息系统抽取、连接和分析各种异构数据,加快破案进程。但是,由于缺乏专业知识,办案人员经常需要在专业人士的帮助下创建数据服务Mashup。
..
2相关技术发展
2.1传统数据集成概述
现代企业中的信息系统开发时间短、开发部门不同,往往有多个异构的、在不同的软硬件平台上同时运行的信息系统。这些系统的数据源彼此独立、相互封闭,使得数据难以在系统之间交流、共享和融合,从而形成了 信息孤岛。信息孤岛造成系统中存在大量冗余数据和垃圾数据,无法保证数据的一致性,从而降低信息的利用效率。随着信息化应用的不断加深,各个企业与外部信息交互的需求日益强烈,外界用户也迫切需要对已有的信息进行整合,联通信息孤岛,由此人们开始密切关注数据集成研究。上个世纪七十年代数据集成开始得到广泛的关注,随着不断研究与发展,有关数据集成的应用也不断扩大。早期,数据集成研究的主要方向是在不同的计算机系统上进行互动和通信,以此来解决语法及结构不同而引发的问题,实现数据模式透明化。在此期间,主要代表产品是多数据库系统和联邦数据库等。受发展限制,这些产品大多实现的是数据库之间的集成,所以限制了数据集成技术用户的使用范围,只有专业的数据库开发人员才能对系统进行操作管理,甚至只能是数据的幵发和设计人员。到九十年代中期,数据结构快速增加,编程模式也在不断发展,数据集成技术的主要研究是将各种异构的数据进行集成。为解决将不同类型数据源进行集成,编程模式在从面向过程到面向对象的过程中发生一些改变,产生了以中介系统为代表的数据集成系统,对数据源的集成操作也由数据库的幵发者转为数据源包装器的幵发者,但是他们并没有对数据源的控制权,而是通过数据集成系统这个中介平台对数据源的包装器进行一些协调工作。本文将以上提到的这些数据集成工作统称为传统数据集成。本文将针对性的讲述两种数据集成工作:模式集成方法和数据复制方法。
2.2面向服务的数据集成
互联网对用户高度开放和不断动态更新的特点使互联网上的数据源的分布、异构、自治的特性更为突出,这使得传统的数据集成方法不再适用。本文根据数据的异构性将数据分为三类:结构化数据、半结构化数据、无结构数据,数据分类详细信息如表2-1所示。为了解决互联网跨域信息资源高度的异构性带来的数据集成问题,同时考虑到数据源的可靠性、私密性、安全性,越来越多的研究工作开始将具有标准性、松稱合、跨平台等特性的服务作为基本抽象应用在互联网环境下的数据集成。服务是面向服务架构(SOA)中的重要概念,是为了解决在互联网环境下跨域的应用
                
原创力文档
                        

文档评论(0)