- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
...
...
时空数据分析算法及其应用研究
空间和时间是现实世界最基本、 最重要的属性, 许多空间应用系统都需要表
达地学对象的时空属性, 例如在地理位置变更、 环境监测、 城市演化等领域都需
要管理历史变化数据,以便重建历史、跟踪变化、预测未来。面向对象的技术是
用在软件设计中的一种方法, 它用在时空数据
[1]表达中主要是为了克服给定实体
的空间或非空间属性在不同时间不同频率变化而出现的复杂问题
[2]
。下面从 KNN、
RNN、SkyLine三种时空数据分析算法出发,论述时空数据分析算法的应用。
1、KNN分析算法的基本概述及应用分析
KNN算法是非参数回归模型的基本算法之一,通过在状态空间中搜索与待测
点X相近的 k个样本 (Xi ,Yi ) 估计 gn(x) ,因此又称为 k最近邻非参数回归,其预测
函数
[3]可表示为
k k
Y=g(X)= Wi (X;Xk1,? , Xkk)Yi = ki Yi (1)
i 1 i 1
其中 Xk1.表示与 x距离最近的点,并赋予权值k1;Xk2则被赋予权值k2;以此
类推,得到k个权函数 k1,k2,?,kk,满足
k
k1≥ k2≥ ? ≥ kk≥ 0, k =1 (2)
i i 1
KNN算法通过计算样本个体之间的距离或者相似度来寻找与每个样本个体最
相近的 K个个体,在这个过程中需要完成一次样本个体的两两比较,所以算法的
时间复杂度,跟样本的个数直接相关。
K最近邻算法通常情况下是用于分类的, 这只是对 K近邻算法用途的本质说明
[4]。从实际来看, K近邻算法可以应用的地方还有很多,比如系统推荐等等。简
单的讲,就是挖掘出客户喜欢的相同商品, 来进行相似物品的推荐。 另外区分客
户群体,从而使我们更好的为客户服务。
下面是 KNN分类器构建实例。 KNN的实现分训练和识别两步。 训练时, 把每类
样本降维后的结果作为 KNN的输入。如图1所示,圆圈表示待识别数据所处的位置,
选择K值为3时,选中实线圆中的 3个数据,识别结果为三角形代表的类;选择K
值为 5时,选中虚线圆中的 5个数据,识别结果为正方形代表的类。
- 1 -
图1 KNN分类器构建
关于智能商务中的聚类算法等, 已经应用于很多系统中, 比如推荐系统、 文
本分类系统等等
[5]。这其中衍生出的产品或者项目都已经被广泛使用于电子商务
领域。为了增加交易, 满足不同的顾客的需求, 研究人员已经推出了利用消费者
访问和购买的行为的推荐系统。 广泛应用在大的超市或者企业中。 这些系统通常
通过给顾客一些与他购买物品高度相关联的推荐物品, 来增加购买和交易。 比如
亚马逊是通过偏好和用户信息和购买信息来向顾客推荐相关书籍。 并且在这过程
中,使用的技术并不复杂,而这不妨碍推荐系统的精确有效。
2、RNN分析算法的基本概述及应用分析
通常, RNN查询
[6]的定义为:给定一个数据点集合P和一个查询点 q,单色反
向最近邻查询 (Monochromatic Reverse Nearest Neighbor Query,RNN) 找出所有
以查询点 q为最近邻的数据点,即 RNN(q)={p∈P丨? p’∈P
s.t.d(p,p ’)d(p,q)} ,其中 d是一个距离度量。给定两个数据集P和Q以及一个
查询点 q,双色反向最近邻查询 (Bichromatic Reverse Nearest Neighbor
Query,bRNN)找出所有的数据点 p∈P,满足 p与q之间的距离比 p与Q中任意一个点
的距离都要短,即 bRNN(q)={p∈P丨? p’∈Q s.t.d(p,q ’)d(p,q)} 。
[7]
图1展示了该查询算法的一个实例 ,图中显示有四个数据点,每个数据点
都对应一个限定圆,查询点 g落在数据点 p1,P2对应的限定圆中,因此p1,P2就
是g的RNN查询结果,即 RNN(q)={Pl ,P2)。
- 2 -
图2 查询实例
近年来,反向最近邻查询学术界得到了深入探讨和研究, 并且在诸如决策支
持、资源分配等许多领域得到了广泛应用。 例如利用随机神经元网络方法和辐射
神经元网络方法设计分布式数据库系统,从而确定数据的物理分段方式
[8];再如
利用基于随机神经网络的时延预测模型对时延进行精确的预测, 为实施网络拥塞
控制、路由选择提供重要的依据
[9]。
3、SkyLine 分析算法的基本概述及应用分析
近年来,流数据挖掘与管理成为学术界和工业界所共同关注的问题, 并且随
着信息技术的不断发展和应用的不断深入, 数据收集手段越来越丰富, 海量存储
也越来越普遍。由此,一种新的操作算子 --skyline 操作被引入了数据库领域,
目的是要发现数据集中不被其他点支配的所有点的集合
[10]
文档评论(0)