- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
空难事故跨媒体信息采集与检索方法研究
空难事故跨媒体信息采集与检索方法研究
摘要:针对民航空难事故信息来源广泛,数据形式呈现多样性,信息检索不方便的问题,提出了基于J2EE的空难事故跨媒体信息管理的设计思路。采用webmagic实现了跨媒体数据的采集,运用Maven与Java开发工具,实现了空难事故信息从数据层到应用层的存储与检索,有效解决了以文本、图像和视频等单一媒体表现形式描述民航空难事故信息的不足,为航空安全事故的关联分析提供了技术支持。
关键词:民航空难事故;跨媒体信息采集;数据存储;信息检索
中图分类号:TP315 文献标识码:A 文章编号:1009-3044(2016)12-0006-04
Abstract :According to the problems of the wide range of information sources, the diversity of data forms and the inconvenience of information retrieval, the design ideas of cross media information management based on J2EE is put forward.Using webmagic to achieve cross-media data acquisition,using Maven and Java development tools,storage and retrieval of information from data layer to application layer is realized, effectively solve the insufficient description of civil aviation accident accident information in single media forms like text, image and video and so on, provide technical support for the analysis of the relationship of aviation safety accidents.
Key words : civil aviation accident; Cross-media information collection;data storage;Information retrieval
1 概述
航空安全一直以来都是人们关注的焦点。随着信息获取、存储和传播技术的飞速发展,网络多媒体资源迅猛增长、多媒体类型及结构日趋复杂化,民航空难信息呈现出多源异构、关联性高、时效性等复杂特征,其内容跨越了文本、视频、图像等多种信息形态,并涉及不同信息源对事件的不同评论等多种属性。“9.11”恐怖事件以来,特别是2014年马航MH370等一系列航空不安全事件引起了全球公众对航空安全更高的要求。基于跨媒体的民航空难事故数据采集、数据存储与检索方法的研究成为了民航空难信息管理与应用研究的热点问题。
2 系统设计
2.1系统架构设计
系统设计分为数据层和应用层。数据层作为最低端为整个管理系统提供数据信息的服务,以JBoss网络服务器为基础,使用网络爬虫的技术把在各个主流民航类网页上的空难事故信息采集下来,以编码的方式对数据进行组织,并存储在数据库中,以便为应用层的信息检索提供服务;应用层作为整个架构的核心层次,在Web服务器上利用webmagic技术采集信息,并对信息进行加工处理;为各种角色的用户提供服务,用户可更加快速准确地查找自己需要的信息。整体框架图如图1所示。
3 信息采集与存储
3.1跨媒体数据的分析与组织
根据民航局对突发事件采取应急措施的相关规定,在对跨媒体空难事故信息的构成进行了详细分析的基础上,采用了信息编码的方法描述跨媒体基本信息,编码设计如图2。
其中:
1) 第 0-7 位,表示事故发生日期 。
2) 第 8-10 位,表示事故发生地,编号方式按照中国居民身份证的编号方式设计,如北京为101,天津为102。
3) 第 11-12 位,表示事故类型,编码方式根据《民用运输机场突发事件应急救援管理规则》的相关规章制度设计,一共13类,如01表示航空器失事,13表示航空器空中出现故障。
4) 第 13 位,表示伤亡程度,从1到6的伤亡程度逐渐加重,如1表示轻伤事故,2表示重伤事故。
5) 第 14 位,表示跨媒体信息属性,其中1表示文本信息,2表示图片信息,3表示视频信息,4表示链接信息。
依照此数据组织形式编写事件
您可能关注的文档
最近下载
- 1桌签格式.doc VIP
- 丰富多彩的中华传统体育+课件 2025-2026学年人教版(2024)初中体育与健康八年级全一册.pptx VIP
- XX能源公司XX风电场×MW工程建设管理制度汇编(总承包项目部)完整版.doc
- 2020抽水蓄能电站施工设计方案.pdf VIP
- 儿童糖尿病酮症酸中毒诊疗指南(2024).pptx VIP
- 虚拟电厂管理平台需求及设计-方案合集.docx VIP
- 茶饮料灭菌技术概述.pdf VIP
- 2025新高考高一函数定义域值域解析式易错培优竞赛试题(解析板).docx
- 常用NTC47KΩ阻值B=3950阻温R-T对照表.pdf VIP
- 歌曲《我和我的祖国》课件.pptx
文档评论(0)