《不良文本变体关键词识别的词汇串相似度计算》.pdfVIP

下载本文档

37
0
约3.72万字
约 7页
2015-11-25 发布于浙江
举报

《不良文本变体关键词识别的词汇串相似度计算》.pdf

第３２卷第３期　　　计算机应用与软件Ｖｏｌ３２Ｎｏ．３２０１５年３月　　ＣｏｍｐｕｔｅｒＡｐｐｌｉｃａｔｉｏｎｓａｎｄＳｏｆｔｗａｒｅＭａｒ．２０１５不良文本变体关键词识别的词汇串相似度计算李少卿　吴承荣　曾剑平　钟亦平（复旦大学计算机科学技术学院　上海２００４３３）摘　要　　随着网络技术的发展，网络空间出现了各种各样的文本交流类网络应用，如聊天室、ＢＢＳ等。为维护网络环境的文明，这些网络应用中会将用户发表的“脏话”词汇进行过滤。有些恶意用户为了避免所发信息被系统过滤，经常会将“脏话”词汇进行变形处理，如何识别这些变形后的“脏话”词汇，是一个重要的问题。通过计算变异敏感词汇相似度，来对变形词汇进行识别。该方法具有如下特点：（１）计算结果接近于人脑识别的结果；（２）计算所用的时间复杂度较低；（３）对变体识别率较高。根据计算的相似度值，来决定是否对该疑似敏感词进行过滤。实验数据表明，所提出

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

《不良文本变体关键词识别的词汇串相似度计算》.pdfVIP

《不良文本变体关键词识别的词汇串相似度计算》.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档