- 10
- 0
- 约8.74千字
- 约 3页
- 2017-09-06 发布于浙江
- 举报
基于电子取证数据的内容分析技术和应用
第43卷第12A期 计算机科学 V01.43No.12A
2016年12月 Science Dec2016
Computer
基于电子取证数据的内容分析技术和应用
曾超1刘晓宇2 林艺滨1 温若辉1
厦门361008)1 北京100006)2
(厦门市美亚柏科信息股份有限公司 (公安部网络安全保卫局
摘要电子取证数据中聊天内容的数据量最大,针对内容的研判分析是重点和难点。通过采用模板、语义分析、
HMM-Viterbi模型对内容提取重要信息,并采用计算文本特征值和深度学习计算语义距离挖掘涉案关键词,并通
过TextRank算法提取内容关键词和自动摘要,从而能够快速掌握大量的聊天内容中的主要内容关键信息,提高工
作效率。
关键词取证分析,语义分析,HMM-Viterbi,TextRank,词云图
中图法分类号TP391.4文献标识码A
Content and on Forensics
AnalysisTechniqueApplicationDigital
ZENGCha01 LINYi—binlWENRuo-huil
I.IU
Xiao-yu2
(XiamenPicoInformationCo.,Ltd.,Xiamen361008,China)1
Meiya
100006,China)2
(CyberSecurityDepartment,Beijing
AbstractInthefieldof forensics,filesofchat havethe datascale,wherethe and
digital history largest difficultyprio-
isto thecontentofthose andHMNI.Viterbimodelwere
rity analyze messages.Differenttemplates,semantic
analysis
tOextractthe ideasoftexts.Meanwhile,utilizationof oftextscombinedwith
employed key eigenvalues deeplearning
in semanticsimilaritieswasusedto outthe of aids
calculating keywords
dig cases.Additionally,TextRankalgorithm
in the andautoabstractofindividual files.A1lthree acceleratethe
drawingkeywords message together
原创力文档

文档评论(0)