- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络不良图片识别技术研究
摘要:党的十九大报告提出“加强互联网内容建设,建立网络综合治理体系,营造清朗的网络空间。”,这是对新时期网络信息内容安全及管理的新要求。该文介绍了不良图片识别技术的发展现状和相关概念,并从卷积神经网络、迁移学习、类别响应图可视化和损失函数五个方面,说明了不良图片识别的有关技术特点和难点。
关键词:信息内容安全;不良图片识别
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2018)12-0195-02
当前互联网络已经成为影响广泛、传播力强大的大众传媒,各种信息通过文字、图片、视频等在网络上传播,极大地满足了公众的信息需求。但是虚假信息、垃圾信息、暴力色情等非法有害信息在网络传播中也不时出现,这给国家和社会带来了不可低估的破坏作用和负面影响。中国互联网络信息中心(CNNIC)发布的《第41次中国互联网络发展状况统计报告》显示:“截至2017年12月,中国网民规模达7.72亿,手机网民规模达7.53亿;网民仍以10-39岁群体为主,其中10―19 岁年龄段群?w占比分别为19.6%,网民中学生群体占比仍然最高,为25.4%。”随着近几年移动社交类、UGC 类平台、App等应用每天产生大量图片,无数暴力、淫秽色情图片混杂其中,将会对青少年的身心健康成长带来不良影响,如何应对网络信息传播中出现的淫秽色情等不良图片信息问题,保障网络信息内容安全,成为业界急需研究的内容。以此为出发点,本文对如何识别网络上的各种不良非法图片进行了研究,以便有效及时的识别发现互联网信息传播中的各种不良非法图片信息,保障网络信息内容安全。
1 网络不良图片识别技术相关研究及概念
1.1 论文统计
在中国知网CNKI中以“不良图片识别”为关键词进行检索,检索时间从2005年1月1日到2017年12月31日,共检索到关于不良图片识别研究的论文2篇(含博、硕士论文)。以“不良图片识别”为主题检索,检索到论文12篇,均为2010年以后发表论文。由此可见业界对此方面的研究还较少,今后还需各界加以重视,加大研究力度。
1.2 相关概念
不良图片识别一般是指基于计算机视觉的不良图片检测。其发展过程主要经历以下三个阶段。第一人工阶段,互联网发展初期,网络信息较少,网络环境也不够稳定,网络不良图片识别主要靠“人肉攻略”,即人工肉眼查看,发现不良图片及时删除。第二算法过滤阶段,随着互联网的快速发展,网络数据量开始剧增,人工识别已难以为继。以肤色识别算法过滤“黄色”图片成为“不良图片识别”主流,此时计算机识别与人工审核分别占80%和20%。第三人工智能阶段,移动互联网的发展产生的网络数据量使人工审核20%的数据也难易实现,加上视频、直播等业务和数据的爆发式增长,纯靠肤色识别算法作为“过滤”的方式已经落后,此时机器学习开始作为一种新的方式,承担起网络不良图片识别的重任。
不良图片识别从机器学习的角度看,本质上是一个图像分类问题,即通过分类器来判断图片是否含有不良信息。一般来说主要有以下三个实现步骤:一是分类器数学模型预定义,即首先定义一个数学模型如[y=F(x)],把待识别的图片[x]作为输入值,然后通过定义设计的数学模型[F], 输出该图片为不良图片的概率[y]。该步骤的关键在于分类标准的定义,即什么样的图片是不良图片。这里的不良图片不单单是指“露点”图片,还包括不“露点”的色情、低俗图片,另外还要排除雕塑、艺术作品等正常图片。二是训练学习,该步骤首先收集大量的样本数据,然后通过图片识别训练学习,进行特征提取,得到数学模型定义中的[F],由于深度学习的神经网络模型在图像识别技术中获得了突破性的进展,目前一般不良图片的识别通常采用CNN(卷积神经网络)、GoogLeNet、ResNet(残差网络)三种深度网络模型结构。通过模型,高效地将图片数据转变成可以运算的数学模型,以便更快更好地得到[F]。三是确定模型,通过第二步的训练学习,经过不断地迭代、算法调参,最终确定越来越精准的数学模型[F]。
网络视频和直播中的不良信息鉴别,在本质上与不良图片识别类似。在鉴别视频和直播中的不良信息时,动态的内容可以解码成图像帧进行判断,这样就与静态图片鉴别方法相似了。
2 网络不良图片识别技术综述
如上所述,网络不良图片识别虽然是个图像分类问题,但是和常见的MNIST、CIFAR、ImageNet等分类任务不同,不良图片识别有如下特点和难点:一是多标签数据。和 ImageNet 等单标签数据集不同,不良图片识别模型面对的图片没有特定类型,画面中包含的物体也没有限制。如穿着暴露的人和全裸露点的人物同时出现在画面内,输出的最终结果不能是色情和性感,而是判定为色情图片,也就是说是
原创力文档


文档评论(0)