- 0
- 0
- 约3.42千字
- 约 6页
- 2022-11-25 发布于重庆
- 举报
?
?
大数据技术在记录刑事调查中呼叫数据记录的应用性研究
?
?
林强 林金山
摘要:不断增长的犯罪率一直是每个国家发展过程中的最大障碍之一。近年来随着大数据技术不断地发展,能有效帮助解决刑事调查中出现的各类问题。文章描述了使用大数据技术分析呼叫数据记录方案的需求,通过对嫌疑人的呼叫数据记录进行分析和处理,找出嫌疑人之间的各种联系,并产生其分析结论作为输出,有效地促进了公安部门的办案效率。经理论分析可得该方案具有很好的效果和推广价值。
关键词:呼叫数据记录;大数据技术;刑事调查;犯罪率;信息安全
:TP311.13 :A :1009-3044(2018)20-0003-02
1 背景
呼叫数据记录CDR (Call data record)由各个电信公司通过使用各种呼叫监控应用程序产生非常大量的信息,CDR记录了各个用户的通信(如短信、通话时间、通话内容等)中的细节而产生的数据记录。一般来说,它是具有4V(Volume容量,Variety多样,Velocity速度,Value价值)特性的数据[1]。CDR不仅数据量庞大,而且数据和结构多样化,还实时生成的速度超出任何计算。值得注意的是CDR包含了巨大的信息价值,常见的CDR主要由以下几部分组成,见表1。
当一件案件发生后,在警方记录和案件证据不足情况下,嫌犯的CDR对案件突破有很大的促进作用。本文中是利用这些数据来分析犯罪嫌疑人的CDR利用一定的算法,来发现罪犯。
2 研究内容
利用犯罪嫌疑人的呼叫数据记录(CDR),以便产生解决犯罪的线索。该方案不仅分析CDR,而且还利用各种CDR之间的各种模式,从而在犯罪解决方面产生显著结果。在实施阶段和部署阶段之前需要解决许多挑战。其中一个主要挑战是数据机密性问题,本方案采用了基于用户数据加密和隐私保护的基础下进行分析和处理的。
传统的获取和分析CDR的一般程序包括:向服务提供商请求CDR,然后将这样获得的CDR移交给进行分析的受过培训的专业人员,最后经过人工分析后,结果可能会得出一些有意义的结论,有助于警方向前迈进。在解决此种方法中存在的问题以及主要缺点,其目标是确保整体过程在时间、效率、努力、可扩展性和准确性等方面取得重大进展,通过使用大数据和数据挖掘的概念来实现这一目标,以重新组织呼叫记录并提取重要的信息,这些信息可以作为案例破解者使用。
3 方案框架
设计方案在以实际分析需求为依据[2],设计一款CDR方案,主要包括两个阶段:
在第一阶段,反犯罪要求上级机关处理各嫌疑人手机号码的CDR。 这些请求经过处理后从全局CDR中提取所需数据。公安部门根据实际需求向通信部门发出嫌疑人CDR数据,即为Request阶段;Process阶段主要是通信部门在接到公安部门的数据请求后进行身份核实和授权的工作;Extract阶段主要是指通信部门根据公安部门的需求从用户CDR数据中提取出所需的CDR数据;Generate阶段主要内容为将普通的CDR数据进行加密处理,设置陷门;Send阶段主要工作为将Generate阶段生成的特殊格式数据通过专属通道传输该公安部门。
在第二阶段中,根据反犯罪团队输入的标准和疑问,方案及时处理提取的CDR。 在此之后,各种算法以多种方式工作,以便生成可能指示更真实的正确方向的挖掘输出。
此阶段的工作主要是针对数据使用者(公安部门)。当公安部门(反犯罪部门)获取到所請求的数据后,通过私有密钥进行对该CDR数据解密操作。即Decryption阶段;Cleaning阶段主要是对第1步骤解密的CDR数据进行清洗和格式化,对一下不需要的指标进行删除操作;Establishment阶段的主要工作内容为建立统一格式的CDR专用数据库,建立数据库的作用主要是为了提高数据分析的准确性;Multi-analysis阶段主要内容为对第4步骤的数据从专属数据库中读取后进行多维分析和模型分析,其该对阶段还包括对数据训练,从第4步中读取的数据进行模型的训练;Result阶段指分析结果得出。该方案不仅节省了大量的时间和人力,而且还提供了准确和适当的结论或推论的保证。
4 理论分析
上述方案的整体处理流程从CDR数据的请求,数据处理到最后的分析,并得出结果。参考图3可以更好地理解这一点。全局CDR通过使用MapReduce技术进行存储,该技术将文件分割成大块并将其分布到群集中的节点上。数据存储在键值对中,可以用数学方式表示如下:
步骤1:从全局CDR中提取信息,全局CDR存储在HDFS中,HDFS是一个分布式,可扩展且可移植的文件方案,用Java编写,用于Hadoop框架。所请求的手机号码从该文件方案中提取,并存储在一个单独的CDR文件中,该文件包含仅限于这些号码的CDR。
步骤2:将日志格式的CDR文件转换为数据库格式CDR文件为日志格式,因
您可能关注的文档
最近下载
- 如何找回误删微信好友,微信好友一键恢复.doc VIP
- 2012韩山师范学院专升本插班生考试《数据结构》试卷.pdf VIP
- Dragons: Riders of Berk《驯龙记:伯克岛的龙骑手(2012)》第一季第六集完整中英文对照剧本.docx VIP
- 供电设备、供水设备运行维护管理方案.pdf VIP
- 股票操作手册.pdf VIP
- 信息安全管理平台构建与企业安全大数据战略.docx VIP
- 大数据时代企业管理会计问题及对策.docx VIP
- 大数据对企业管理的影响.doc VIP
- 2023大型娱乐场所综合能源服务项目规划设计典型案例.docx VIP
- 2023科技园区综合能源服务项目规划设计典型案例.pdf VIP
原创力文档

文档评论(0)