网站大量收购独家精品文档,联系QQ:2885784924

内容审核基础:审核方式、流程与审核维度 .pdfVIP

内容审核基础:审核方式、流程与审核维度 .pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

内容审核基础:审核方式、流程与审核维度

对于资讯类产品和内容内产品来说,内容审核是必不可少的环节之

一。借助人工智能的发展,可以让机器替代一部分审核工作,但由于

内容的复杂性,人工审核必不可少,而且还有其他需要考虑的点。这

篇文章,作者为我们讲解内容审核的方式与流程,希望能对你有所帮

助。

何为内容审核?

简单来说就是:对用户在社交平台上上传、发布或共享的内容(文字,

图片,音频,视频)进行审查。

其主要目的是对低质庸俗的内容进行过滤筛选,从而生产高质量的内

容、防止降低用户体验、保持良好的内容调性。

而在这个过程中,平台会对于内容有一个专业的标准作为参考,这个

时候有一个很大的问题就是人工筛选效率低,而且成本大。

所以很多内容平台采用了算法进行过滤,通过人工和算法的有效结合

来提升效率。

经过过滤后的内容基本上能保证无害,即使质量不高,但也不存在风

险问题。这时企业就会面对选择是先发后审还是先审后发:

“先发后审”:即用户先发表UGC内容,再经过审核;

“先审后发”:即用户提交UGC内容后,先经过审核,审核通过后才

能发表上线。

“先发后审”和“先审后发”的适用场景:

“先发后审”:适用于对发表内容时效性要求较高的场景,如阅读、

听歌等场景下的用户评论,此时用户发表评论更多出于即兴,因此从

用户的角度考虑,希望自己发表的评论能够马上看到成功、有效。比

如:网易云音乐评论。

“先审后发”:适用于在社区、论坛、新闻平台等场景下发表文章、

观点、讨论等,此时对于平台方来说需要对内容负责、并构建权威性,

因此通常要审核后才能发表。比如:抖音、人人都是产品经理。

一、审核方式

不管是什么内容的审核,都应该包含以下四个基础模块:机器审核、

人工审核、用户投诉审核、结果复审。

1.机器审核

是按照制定好的规则或机器学习算法对内容进行审核.

通常,成熟的审核系统能将95%甚至99%以上的内容都自动审核并

做出处理。确定有问题的会被自动删除,难以判断是否有问题的会被

标注,进入人工审核程序。

2.人工审核

虽然用户投诉审核和结果复审大多时候也是人工审核,但这里所说的

人工审核,特指审核机器无法判别的内容,通常占平台内容数量的比

例不超过5%.

但对于一些大型的内容平台,绝对数量已经很多了。在内容爆炸的时

代,我们看到许多平台在全国都有多个审核中心,每个审核中心的员

工数量都成千甚至上万。

3.用户投诉审核

是前两者的弥补,有很多违规内容以前没有出现过;所以不在规则可

以过滤的范围内,或者非常隐蔽,规则难以严格过滤。

用户的投诉是发现新问题的重要渠道。通过知乎的危机事件,我们更

应该重视对投诉的审核,并及时据此对机器审核做出补充。

4.结果复审

通常采取抽查方式,比如通过复审机器删除的内容,看规则或算法是

否过于严格;比如通过查看人工删除和通过的内容,看员工的工作是

否按要求执行;比如通过内容的整体巡查,看是否存在新的问题未被

注意到。

二、审核流程

具体流程,以下图为例:

先过机器审核,机器审核通过或不通过;

对机器审核不通过的,再进行人工复审;

对机器审核通过的,再进行人工抽样审核。

三、审核的四个维度

这里一般都是对四个维度进行审核,关键字审核,用户发布次数限制,

重复内容过滤和白/黑名单用户。

1.关键词审核

词语过滤的环节,关键词主要分为三类:

1)禁止关键词

只要匹配到这个词,内容就被自动删除或禁止提交。通常只有极少数

词会被纳入禁止关键词,比如明确的色情、邪教以及广告的专属关键

词。

2)审核关键词

这是最常见的关键词种类,只要匹配到就会自动进入后台进行审核,

文章中的关键词会被高亮并罗列出来,有助于审核人员快速判断。审

核关键词也应该尽量是专属关键词,以防止太多内容被拦截到后台。

3)替换关键词

在许多平台,我们会在文中看到莫名的号或字母缩写*,这可能不是

文章作者写的,而是这个词被系统自动替换。平台不希望出现这个关

键词,但用别的代替读者通常也能读懂。比如一些政治、宗教、不文

明用语类词语,都有可能被自动替换。

当然,管理员在添加关键词时,很多时候并不是直接把关键词添加到

后台。否则用户用很简单的方式就可以避过关键词过滤,比如在关键

词内加一个空格,系统就难以匹配到。

所以,一般后台都会支持限定符{x}以限定相邻两字符间可忽略的文

字,x是忽略的字节数。在Discuz!网站后台有明确说明,如

#8220;a{1}s{2}s#8221;(不含引号

文档评论(0)

177****3106 + 关注
实名认证
文档贡献者

大学本科生

1亿VIP精品文档

相关文档