基于数据挖掘模型交通事故原因分析方法研究.pdf

基于数据挖掘模型交通事故原因分析方法研究.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于数据挖掘模型交通事故原因分析方法研究.pdf

一、交通安全与事故预防 ·259· 基于数据挖掘模型交通事故 原因分析方法研究 朱 茵 王军利 郑英力 102614 (交通管理工程系 中国人民公安大学 北京 010 【摘要】本文分别从结构化信息源两个角度探讨支撑公安交通事故成因分析的数据挖掘模型,提 出利用粗糙集理论的基本原理,对于其属性约简进行改进,在保证原有属性不变的条件下,削减了冗余 信息,并可实现基于数据库存储数据的动态数据挖掘模型,避免了将大量数据从数据库中基于主题导入 数据仓库的传统数据挖掘模式。通过上述算法,不仅提高了信息挖掘的效率,而且可以实时在线信息挖 掘,相对于传统的挖掘模式,本文提出的方法更适用于当前基于网络的交通事故成因分析的实际应用。 【关键词】数据挖掘交通事故分析方法 本论文研究得到公安部软科学项目资助(项目编号:2005GADXLLYJ042) 1.引言 随着城市机动车保有量的增加,交通事故成为公安交通管理关注的焦点,随着相关理 论研究的逐步深入对于交通事故原因的分析也将会成为公安交通管理预防事故发生的一一个 重要手段之一。以首都北京为例,截至2005年6月20日,首都上半年共发生道路交通死 亡事故574起,死亡634人,以上半年的交通事故情况进行分析,其道路交通事故原因有 以下特点: ●事故发生时间情况分析 从时问分布统计分析,18时至24时最为突出,占死亡总数的36%; ●事故发生区域分布情况分析 从区域分布统计分析,远郊区县最为突出,占死亡总数的64%; ●交通方式情况分析 从交通方式统计分析,机动车肇事最为突出,占死亡总数的86%; ●事故肇事人情况分析 从驾驶人驾龄统计分析,驾龄在3年(含)以下的机动车驾驶人肇事也较突出,占 死亡总数的17%。同时,从肇事人酒后驾车肇事死亡34人;非司机驾车肇事死亡8人。 上述统计结果,更多的是停留在基于原始统计数据的人工统计上,还没有形成基于智 能的数据分析系统,计算机往往作为数据累加和存储的工具,而并没有充分发挥基于计算 机的智能分析系统,构建交通事故原因分析系统,提高公安机关的交通事故成因分析能 力,是今后公安交通管理建设的重点内容之一。随着信息采集、信息存储设备的飞速发 ·260· 关爱生命预防事故 展,公安部门已经拥有大量的相关信息做支撑。然而目前更多的是在数据处理层面上只做 简单的处理,缺乏相应的手段来挖掘数据背后隐藏的知识,无法发现并利用数据中存在的 关系和规则,从而根据现有的数据预测未来的发展趋势,并进一步辅助决策者更好地利用 有效数据进行科学决策。在这种现状下,需要一种新的技术方法,即数据挖掘来充分挖掘 这些有效信息,为科学高效率地实现交通事故原因分析的应用奠定基础。…本文就是在此 基础上,利用数据挖掘相关模型实现对交通事故原因分析的功能。 2.数据挖掘模型 大量的数据挖掘算法是基于数据仓库的基础上形成的,而在公安交通事故成因分析的 研究与开发中,往往很多数据是存储在综合信息数据库中,而未导人数据仓库中,从这一 意义上而言,本文对于动态数据挖掘的需要更强于基于数据仓库的挖掘算法,基于此,本 文提出利用粗糙集(RoughSet,RS)理论的基本原理,对其属性约简进行改进,并可实 现基于数据库存储数据的动态数据挖掘模型。 2.1RS相关基础理论 Rs理论是一种刻画不完整性和不确定性的数学工具,能有效地分析和处理不精确、 不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。[2儿副但是, 由于在Rs中的规则约简中,只能保证确定规则在约简前后不被改变,这就必然会带来很 大的局限性。因为,在实际系统的应用中不确定规则是较为普遍存在的,所以有必要通过 相应算法的改变,保证确定规则与不确定规则在约简前后均不会被改变,改进后的约简算 法,同时保留确定规则和不确定规则的可信度,更加符合实际需求。另外,在实际应用 中,为减少动态概念属性约简过程的运算时间,一般可先在离线状态下进行底层属性约 简,再

您可能关注的文档

文档评论(0)

带头大哥 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档