基于密度的DBSCAN聚类算法的研究及应用_冯少荣.pdfVIP

基于密度的DBSCAN聚类算法的研究及应用_冯少荣.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于密度的DBSCAN聚类算法的研究及应用_冯少荣

2162007,43(20) ComputerEngineeringand Applications计算机工程与应用 基于密度的DBSCAN聚类算法的研究及应用 1,2 1 冯少荣 ,肖文俊 1,2 1 FENG Shao-Rong,XIAO Wen-Jun 1.华南理工大学 计算机科学与工程学院,广州 510640 2.厦门大学 信息科学与技术学院,福建 厦门 361005 E-mail:shaorong@ Engineering and Applications,2007,43(20):216-221. datamining 点、存在的问题及改进思想,提出了基于DBSCAN方法的交通事故多发点段的排查方法及其改进思路,并且给出了实例以说明处 理过程及可行性。实验结果表明本文提出的方法可以大大提高交通事故黑点排查效率。 关键词:聚类分析;DBSCAN;交通事故多发点(段);数据挖掘 文章编号:1002-8331(2007)20-0216-06 文献标识码:A 中图分类号:TP311.13 1 引言 是:对于构成交通事故多发点段的每个交通事故,其发生的地 交通事故多发点段可以理解为一条交通道路上发生交通 点半径ε(邻域)公里范围以内的其它交通事故的个数,必须不 [10-17,44-52] 小于一个给定的阈值(MinPts),也就是说其邻域的密度必须不 事故密度大的地方 ,DBSCAN算法是基于密度的聚类分 [2-4,6,8-9,18-39] 小于某个阈值。 析 算法。应用在交通事故多发点段的排查中就是基于 交通事故密度的交通黑点查找的聚类分析算法,而基于密度的 下面是DBSCAN算法的交通事故多发点段排查方法在交 [1-9,40-43] 通事故黑点排查中的一些定义: DBSCAN算法基本思想就是通过不断地搜索临近点来使 核对象周围的密度逐渐增加,寻找到一个区域内所查找点或对 (1)定义1(核心交通事故点)给定ε、MinPts,若交通事故 象密度大的地方。算法中所要研究的点可以描述为交通事故发 点p的ε邻域包含的交通事故对象个数|Νε(p)|≥MinPts,则称 生的地点,对于算法中的ε-近邻区域可以理解为道路的公里 p是核心交通事故点。 数,因此 DBSCAN算法在道路交通事故多发点段的智能排查 (2)定义2(直接密度可达)给定ε、MinPts,事故p是从事 上就可以理解为排查在半径为ε公里内发生MinPts以上交通 故q出发直接密度可达的,当: 事故的地点或者路段。这也和我国对于交通事故多发点段的规 ①p∈Νε(q); 定不谋而合。所以可以采用DBSCAN技术的方法对交通事故 ②Νε(q)≥MinPts。 多发点段进行排查。 (3)定义3(密度可达)给定一个交通事故集合D,当存在 一个事故对象链p,p,…,p,p=q,p=p,对p∈D,p是p关 1 2 n 1 n i i+1 i 2 基于DBSCAN算法的交通事故多发点段排查方法 于ε和MinPts直接密度可达的,则称事故对象p从事故对象q [10-17,44-52] 关于ε和MinPts密度可达(非对称)。 2.1 核心思想 基于DBSCAN算法的交通事故多发点段排查方法的思想 (4)定义4(密度相连)如果事故对象集合D中存在一个 放计划重点项目(No.2003H043)。 作者简介:冯少荣(1964-),男,副教授,在职博士研究生,主要研究方向:并行分布数据库、数据仓库、数据挖掘;肖文俊(1950-),男,教授,博士生 导师,主要研究方向:网络理论和并行分布式算法,网络和复杂系统及其应用,并行分布式计算及

文档评论(0)

wnqwwy20 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7014141164000003

1亿VIP精品文档

相关文档