时空共现模式在流数据上发现.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
时空共现模式在流数据上的发现 汇报人:霍江涛 2013年3月22日 概要 背景知识 相关工作 研究工作 总结和展望 背景知识 时空共现模式定义 R(A,B)Ð 共现率ρ A:Nx B:Ny Ñ=0.5 (A,B)=(x,y) ρ:Min(x/Nx ,y/Ny) ρ=0.5 时空共现模式属性 ABC(23-1) (A,B,C,AB,AC,BC,ABC) ABCD(24-1) (A,B,C,D,AB,AC,BC…,BCD,ABCD) (ABCDE)(25-1) … (ABCDEFGHIJ)(210-1) 类别N----时间复杂度O(2N-1) 研究动机 时空共现模式在社会诸多领域有着应用广泛 查询建议 朋友推荐 服务推荐 科学 , 生态学 ,医药卫生,…. 目前的研究集中于静态的数据集 不能有效的反应出时空共现模式中的变化趋势 不能反应当前模式与先前模式之间的关系 相关工作 空间共现模式发现 时空共现模式发现 基于时间序列的模式发现与匹配 相关工作 空间共现模式发现 相关工作 时空共现模式发现 时空阈值(θs, θt ) 单次时间: 多次时间: 相关工作 基于时间序列的模式发现与匹配 模式发现 模式匹配 研究工作 基于流数据 新的参与度计算方法 渐增交叉性时空共现模式发现 共现模式随时间演化的趋势发现 权重:W(A)=(A在相关共现事件参与次数) 哈希树:存储每次共现事件类型。 哈希表:存储与每个类型事件共现的其他事件。 A B C D E F ….. 1 1 1 1 1 1 处理流程 Input: (t0) A1 1.6 1.6 A2 1.3 1.6 A3 2.6 2.5 A4 2.7 0.2 A5 2.8 0.7 B1 1.8 1.8 B2 1.7 1.4 B3 1.3 1.3 B4 1.6 1.1 B5 0.5 0.5 B6 0.3 0.2 B7 2.5 2.7 C1 1.5 0.9 C2 1.8 0.9 C3 0.25 0.4 ……… 交叉性时空共现模式发现 度量要点 决定需要处理的网格 决定需要处理的事件 将交叉性共现事件映射到下一个时间片 冲突解决 处理网格 假设在一个网格中共有k种事件,每种事件的数量为Ni (1=i=k) 一个网格中所有事件总数为: Sum(objects)=N1+N2+…..+Nk 假设我们一共有M 个网格,那么每个网格的平均事件数为: P=Sum(objects)/M 需要处理的网格阈值为: θ=λ1P(λ1=0.8) 需要处理的事件数量阈值为: Ni λ2Sum(objects) 冲突处理 映射相关网格包含有相同数据集 忽略事件ID,直接映射 映射网格中相关类型事件数量达到一定比例: 当Ñi λ3Sum(objects)/k(λ3=2),不再映射进新网格 当前时空共现模式 时间序列:t0,t1,t2,t3,t4,t5,t6,t7,t8,t9,t10... 定义衰减因子 λ 各时间片内共现模式 t0:(A,B)-(X0AB,Y0AB),(A,C)-(X0AC,Y0AC)…(N0A,N0B,N0C) t1:(A,B)-(X1AB,Y1AB),(A,C)-(X1AC,Y1AC)…(N1A,N1B,N1C) …. 整合入历史数据后的共现模式 t10:(A,B)-(X10AB,Y10AB),(A,C)-(X10AC,Y10AC)…(N10A,N10B,N10C) T(A,B)=(XAB,YAB)-----(NA,NB) XAB=X10AB+ λX9AB+ λ2X8AB +…..+ λ10X0AB YAB=Y10AB+ λY9AB+ λ2Y8AB +…..+ λ10Y0AB NA=N10A + λN9A +λ2N8A +….+λ10N0A NB=N10B + λN9B +λ2N8B +….+λ10N0B 共现率T(A,B): min(XAB/NA, YAB/NB) 最终共现模式的正确性 共现率T(A,B): min(XAB/NA, YAB/NB),阈值为μ XAB/NA= (X10AB+ λX9AB +…..+ λ10X0AB)/(N10A + λN9A ….+λ10N0A ) 在上式中有, (1) X10AB /N10A (μ N10A) /N10A … X0AB /N0A (μ N0A) /N0A (2) N0A /N10A = α0, N1A /N10A = α1, N2A /N10A = α2,….., N9A /N10A = α9 (3) XAB/NA = (X10AB+ λX9AB +…..+ λ10X0AB)/(N10A + λN9A ….+λ10N0A ) =(X10AB+ λX9AB +…..+ λ10X0AB)/

文档评论(0)

187****5045 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档