内容安全技术.ppt

内容分类 ? 内容分类是指过滤系统检查流经的文本、根据特征数据库判断文本属于哪一类文本的操作。 ? 在向量空间模型中一般通过计算流经文本特征向量(W1,……,WN)和目标特征向量(W1*,……,WN*)的相关系数来判断类别:当相关系数大于一个阈值时,可判断流经的文本属于目标特征(W1*,……WN*)对应的哪一类文本。 内容分类 话题发现和跟踪 话题识别与跟踪技术是一种能自动 确定新闻信息流中话题结构的技术。它主要以网络新闻。广播和电视信息流为处理对象,将内容按话题区分,监控对新话题的报道,并将涉及某个话题的报道组织起来,以某种需要的方式呈献给用户。 话题发现和跟踪 分词报道切分 新事件识别 报道关系识别 话题识别 话题跟踪 报道切分是指将从一个信息源获得的语言信息流分割为不同的新闻报道。一个新闻栏目通常包括很多条新闻报道,而这些新闻条目之间一般有一定的分割表示,或者在内容编码上有一些变化,这些都是分割的依据。 报道切分 * * 内容安全技术 文本过滤 、话题发现和跟踪 传世 为您整理 文本过滤 话题发现和追踪 文本是最常出现的应用层数据形式之一。文本过滤属于被动的内容安全技术,它不仅可以用于防火墙,也适用于阻止垃圾邮件,防范信息泄露,搜索网络敏感内容,这些应用也需要从截获或搜索到得数据中发现特定的文本内容或对文本进行分类,执行相应的安全策略。

文档评论(0)

1亿VIP精品文档

相关文档