网站大量收购独家精品文档,联系QQ:2885784924

基于规则匹配的道路交通事故重要信息抽取方法研究.pdf

基于规则匹配的道路交通事故重要信息抽取方法研究.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

AcademicPapers学术交流

影响有影响的人

基于规则匹配的道路交通事故

重要信息抽取方法研究

章稷修,李翠翠,李柏丹,朱胜浩

(交通运输部规划研究院,北京100028)

摘要:针对道路交通事故报告,提出基于规则匹配的道路交通事故重要信息抽取方法。首先,结合道路

交通事故报告特点构建道路交通事故关键信息指标体系,并对非结构道路交通事故报告进行分句、分词处理;

其次,构建每项指标的提取规则进行信息提取;最后,将提出的基于规则匹配模型的道路交通事故重要信息

抽取方法应用于实际案例,验证模型的有效性。实验结果表明,采用此方法能够较为准确地抽取道路交通事

故重要信息。

关键词:道路交通事故报告;重要信息;信息抽取;规则匹配模型

中图分类号:U491文献标识码:A

0引言于中文NER的格结构LSTM模型,该模型对一系列输入字符

预防道路交通事故对社会经济稳定运行具有重要意义。以及所有与词典匹配的潜在单词进行编码。Yang等[2]提出了

道路交通事故报告是对历史道路交通突发事故的真实记录,描一种在中文命名实体识别(NER)中执行群组注释学习的方法,

述了事故发生的过程,具有分析、预防道路交通事故的重要信构建中文实体识别系统。Dong等[3]提出应用一种双向LSTM-

息。当前道路交通事故报告主要以非结构化文本为主,使用率CRF神经网络进行实体信息识别。

较低。如何快速、高效地从道路交通事故报告中提取结构化的基于规则匹配的信息抽取方法方面,张伟等[4]提出一种

事故关键信息,对后续交通事故分析研究具有重要意义。基于词性标注和规则相结合的信息抽取方法,对企业日常经营

活动文本进行结构化信息抽取。吴欢等[5]总结解放军总医院

1国内外研究现状第一医学中心乳腺癌病理报告结构及特点,利用基于规则的模

早期对道路交通事故报告关键信息提取方式以人工阅读、式匹配抽取方法对病理报告进行信息抽取。余晨等[6]针对大

手动录入为主,耗费大量人力物力。近年来,随着自然语言量非结构化海事事故语料的分析总结,编制抽取规则进行海事

处理技术的快速发展,信息抽取技术作为知识图谱、文本结信息的抽取。李雪驹等[7]提出了一种基于规则与SVM相结合

构化的主要使用技术。当前,有两种常用的信息抽取技术:的PDF论文抽取方法,能够对论文元数据和章节标题等信息

一是基于机器学习的信息抽取方法;二是基于规则匹配的信进行抽取。

息抽取方法。由国内外文献可知,对于表达方式具有较强规律性的文本,

基于机器学习的信息抽取方面,Zhang等[1]研究了一个用更适用于基于规则的信息抽取方法;对于表达方式规律性较差

68

NO.4/AUGUST.2024

交通建设与管理影响有影响的人

的文本,更适用于基于统计机器学习的方法。对大量的道路交2所示。

通事故报告进行阅读与分析后,发现道路交通事故报告的文本

文档评论(0)

经管专家 + 关注
实名认证
服务提供商

专注于经营管理类文案的拟写、润色等,本人已有10余年相关工作经验,具有扎实的文案功底,尤善于各种框架类PPT文案,并收集有数百万份各层级、各领域规范类文件。欢迎大家咨询!

版权声明书
用户编号:6055234005000000

1亿VIP精品文档

相关文档