网站大量收购闲置独家精品文档,联系QQ:2885784924

, v 1,v 2v 2,v 3…v m1,v m ..pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
, v 1,v 2v 2,v 3…v m1,v m .

1000-9825/2002/13(08)1465-07 ©2002 Journal of Software 软 件 学 报 Vol.13, No.8 一种无线通信环境中用户移动模式的挖掘算法 1 1,2 1 1 3 宋国杰 , 唐世渭 , 杨冬青 , 王腾蛟 , 叶恒强 1(北京大学 计算机科学技术系,北京 100871); 2(北京大学 视觉与听觉信息处理国家重点试验室,北京 100871); 3(广州新太科技股份有限公司,广东 广州 510665) E-mail: gjsong@ 摘要: 发现无线通信环境中用户的移动模式是移动对象管理中的一个关键问题.提出一种快速挖掘该模式的算 法SAM(split and merge),用来挖掘移动对象所产生有序数据集中潜在的移动模式,从而为移动对象管理提供服 务.该算法将自底向上搜索和自顶向下过滤技术相结合,采用图存储压缩数据集方法,利用非频繁项集分解子图 和频繁长模式过滤数据集相结合的技术, 大大减少了迭代次数,降低了CPU 时间.最后给出了算法性能比较和算 法分析.结果表明,该算法是有效的. 关 键 词: 数据挖掘;最大频繁项集;移动模式;移动对象管理;移动通信 中图法分类号: TP393 文献标识码: A 随着定位技术(如 GPS 等) 、无线通信技术和电子技术的发展,使得我们可以对移动对象(如 PDA,车辆等) 进行跟踪定位.移动对象管理与移动对象的跟踪、定位、记录、查询等密切相关,而这些功能的有效实现需要 用户移动模式的有效支持.挖掘用户的移动模式不仅可以为移动对象管理服务,而且在交通管理、广告发送、 安全、旅游等基于位置的服务中有着广泛的应用前景. 本文所要挖掘的移动模式是最大频繁移动模式集,这是因为在移动管理中往往需要最大模式[1,2].所谓最大 移动模式是指在模式集中不存在任何模式为该模式的超集.求取最大模式集的方法有 Max-Miner [3] ,Pincer- Search[4]等.但它们有一个共同点,数据集是无序的、离散的,不适合求解连续数据集的情况.文献[1,2]提出从无线 用户的移动日志中挖掘出用户的移动模式,但该算法是建立在Apriori 思想的基础上,迭代求出所有模式后再得 到最大模式,这显然是不合适的.文献[5]给出了在移动行为基础上预测用户移动的方法.文献[6,7]讨论了基于图 求解的思想. 在文献[1,2] 的基础上,结合求解问题的特性,我们给出了求解这一问题的方案:首先将数据集转化为移动模 式图集,从而简化计数、压缩空间;然后采用自底向上和自顶向下相结合的策略,利用频繁项集向上搜索和非频 繁项集向下分裂、合并、过滤移动模式图集相结合的方法,加快算法进程,提高算法效率. 本文第 1 节是定义.第2 节给出移动模式挖掘的解决方法.第3 节是性能比较.最后是总结. 收稿日期: 2001-12-08; 修改日期: 2002-04-09 基金项目: 国家重点基础研究发展规划973 资助项目(G 1999032705);北京大学-IBM 创新研究院资助项目 作者简介: 宋国杰(1975 -), 男,河南新乡人,博士生,主要研究领域为数据库,信息系统;唐世渭(1939 -), 男,浙江宁波人,教授,博 士生导师,主要研究领域为数据库,信息系统;杨冬青(1945 -), 女,天津人,教授,博士生导师,主要研究领域为数据库,信息系统; 王腾蛟(1974 -), 男, 山东济南人,博士生,主要研究领域为数据库,信息系统;叶恒强(1964 -),广东广州人,工程师,主要研究领域为移动 计算. 1466 Journal of Software 软件学报 2002,13(8) 1 定 义 为方便讨论,首先引进如下符号说明.移动对象的移动产生一个连续的运动轨迹,该运动轨迹可以由位置l 、 时间t 描述.为了使定义 1 中轨迹P 和定义2 中图G 具有惟一的对应关系,我们在轨迹的边上标记一个连续的 自然数列.移动对象的轨迹可形式描述如下: 定义1. 设l 是有限位置集中的一个元素,t 是到达该位置的时间, l (t ) 表示轨迹中的一个节点,1≤i≤n,n 是序 i i

文档评论(0)

hhuiws1482 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5024214302000003

1亿VIP精品文档

相关文档