- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
8.3.6 SQL Server建立随机时序模型示例 有如表8.8所示的CPI数据表,其中有一部分月份没有给出,采用SQL Server建立其随机时序模型,并预测没有给出的CPI。其过程如下。 Time CPI Time CPI Time CPI(预测值) 2010-01-01 1.5 2011-08-01 6.2 2013-03-01 NULL 2010-02-01 2.7 2011-09-01 6.1 2013-04-01 NULL 2010-03-01 2.4 2011-10-01 5.5 2013-05-01 NULL 2010-04-01 2.8 2011-11-01 4.2 2013-06-01 NULL 2010-05-01 3.1 2011-12-01 4.1 2013-07-01 NULL 2010-06-01 2.9 2012-01-01 4.5 2013-08-01 NULL 2010-07-01 3.3 2012-02-01 3.2 2013-09-01 NULL 2010-08-01 3.5 2012-03-01 3.6 2013-10-01 NULL 2010-09-01 3.6 2012-04-01 3.4 2013-11-01 NULL 2010-10-01 4.4 2012-05-01 3 2013-12-01 NULL 2010-11-01 5.1 2012-06-01 2.2 2013-03-01 NULL 2010-12-01 4.6 2012-07-01 1.8 2013-04-01 NULL 2011-01-01 4.9 2012-08-01 2 2011-02-01 4.9 2012-09-01 1.9 2011-03-01 5.4 2012-10-01 1.7 2011-04-01 5.3 2012-11-01 2 2011-05-01 5.5 2012-12-01 2.5 2011-06-01 6.4 2013-01-01 2 2011-07-01 6.5 2013-02-01 3.2 TS表结构 创建数据挖掘结构 设置挖掘模型结构 时序挖掘图 显示预测值 “模型”选项卡 “挖掘图例”对话框 8.4 时序的相似性搜索 时序相似性搜索是基于内容的查询,用X=(xt | t=0,1,2,…,n-1)表示一个时序,其相似性搜索就是在时序数据库中发现与给定模式相似的序列。 8.4.1 相似性搜索的概念 假设时序模型为AR(n),待测序列X的参数模型为φX,它是待检模型。 序列数据库中的其他序列Yi的的参数模型为φYi,它们是参考模型。φX和φYi都是n维向量,均可视为n维空间上的点。 从而序列的相似性问题就归结为n维空间Rn中的距离的判别问题。 1. 距离判别函数 常用的距离函数为欧几里得函数,其表示如下: 如果待检模型φX与某个参考模型φY的欧几里得距离最小,则它和这个参考序列最相似。 用模型中随机项向量μ(白噪声向量)来构造残差距离函数,其表示如下: 其中,rX是待检序列的协方差矩阵,N表示待检序列的长度。 2. 相似性匹配方式 一般地,事先给定距离函数D和?,时序相似性匹配可分为以下两类: 完全匹配:给定N个序列Y1、Y2、…、Yn和一个查询序列X,这些序列有相同的长度,如果存在D(X,Yi)≤?,那么称X与Yi完全匹配。 子序列匹配:给定N个具有任意长度的序列Y1、Y2、…、Yn和一个查询序列X以及参数?。子序列匹配就是在Yi(1≤i≤N)上找到某个子序列,使这个子序列与X之间的距离小于等于?。 3. 数据变换 对于一个时序X,对其离散傅立叶变换得到Xf: f=0,1,…,n-1 这里,X与xt代表时域信息,而与Xf代表频域信息,={Xf | f=0,1,…,n-1},Xf为为傅立叶系数。 注意:采用离散傅立叶变换后,序列上的每个点(时域信息中)对应特征空间(频域空间)中f维空间上的一个点。 根据Parseval的理论,时域能量谱函数与频域能量谱函数相同,即 在采用欧几里得距离函数时,如果两个序列的欧几里得距离小于?,则如下式子也应该成立: 对大多数序列来说,能量集中在傅立叶变换后的前几个系数,也就是说一个信号的高频部分相对来说并不重要。因此我们只取前面fc个系数,即 这样就滤掉一大批与给定序列的距离大于?的序列。 8.4.2 完全匹配 完全匹配必须保证被查找序列与给出的序列有相同的长度。 完全匹配的过程是:首先进行首次筛选,即从在变换后的频域空间中找出满足上式的序列。由于只考虑了前面几个傅立叶序列,所以并不能保证剩余的序列就相似,还需要进行最终验证。 其次进行最终验证,即计算每个首次被选中的序列
文档评论(0)