基于网络色情图像检测的研究与实现.docVIP

下载本文档

7
0
约3.08千字
约 6页
2016-09-08 发布于北京
举报
版权申诉

基于网络色情图像检测的研究与实现.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于网络色情图像检测的研究与实现.doc

基于网络色情图像检测的研究与实现　　【摘要】对于两幅既有旋转又有缩放变化的图像，如何确定哪些点是兴趣点呢？因为是不会随着图像变化而变化的点，所以就是要找到图像中的一些稳定点，比如角点、边缘点、亮区域中的暗点以及暗区域中的亮点。而Surf算法对于这些点的检测是基于最基本的Hessian近似矩阵。　　【关键词】图像兴趣点积分图像 Hessian矩阵　　对一个数据较大的图像集来说，将里面的图像进行一一筛选分类是一个耗时比较长的工作，并且相对于数据小的图像集而言，这样直接进行分类的结果误判率将明显有所增加。为了较为快速并且精确的区分出所有的图像，我们可以将图像集进行一个数据减小的前提工作，做法是优先排除一些明显合法的图像，然后再从余下的图像集中进行色情图像的识别。　　1 合法图片的识别　　对一个数据较大的图像集来说，将里面的图像进行一一筛选分类是一个耗时比较长的工作，并且相对于数据小的图像集而言，这样直接进行分类的结果误判率将明显有所增加。为了较为快速并且精确的区分出所有的图像，我们可以将图像集进行一个数据减小的前提工作，做法是优先排除一些明显合法的图像，然后再从余下的图像集中进行色情图像的识别。具体做法如下（如图1）：　　（1）图片加载和预处理，图片预处理就是将图片大小规范到统一的尺寸; 　　（2）人脸检测，基于OpenCV中训练好的分类器进行人脸所在图片比例的计算; 　　（3）基于YCrCb的肤色检测，计算去除人脸后的基于YCrCb肤色所在图片的比例，如果满足合法图片的阈值则进行基于纹理的肤色检测，否则进行非法图片检测; 　　（4）基于纹理的肤色检测，满足YCrCb肤色检测为合法图片后，进行纹理的肤色检测，计算去除人脸后的基于纹理肤色所在图片的比例，如果满足合法图片的阈值则分类为合法，否则进行非法图片检测。　　2 色情图片的识别　　经过图像集的缩小工作后，接下来就是通过分类器对图像进行分类，以区分出色情图片和合法图片。色情图像的分类识别步骤如下（见图2）。　　（1）提取图片的Surf特征;（2）对提取的Surf特征进行特征表示，即一个64维向量代表一个特征点;（3）基于BoVW词典的KNN检索，基于BoVW的正向和逆向词典索引，对每个特征描述符通过KNN算法进行检索，计算待测图片中逆向特征描述符的距离均值和逆向特征描述符的比例因子;（4）色情图片的判别，同时满足YCrCb肤色、逆向特征距离均值和逆向特征比例因子三个设定的阈值，即判别为色情图片，否则为合法图片。　　3 算法实现　　（1）训练基于BoVW模型的词典，并对词典进行聚类，输出词典文件，伪代码如下：　　BEGIN 　　While（！readVocabulary（G_vocabularyFile，vocabulary））　　{ 　　定义参数bowTrainer，聚类维数为G_vocabSize 　　While（ readdir（dir）！= NULL ）　　{ 　　检测兴趣点imageKeypoints 　　对兴趣点提取描述子imageDescriptors 　　If（！Descriptors.empty（））　　{ 　　向bowTrainer中加入描述子　　vocabulary = bowTrainer.cluster（）; 　　} 　　输出vocabulary 　　} 　　} 　　END 　　其中，输出词典为vocabulary，dir为训练样本图像集所在路径，bowTrainer类型为BOWKMeansTrainer，词典文件通过G_ vocabularyFile设定，词典训练的维数通过G_vocabSize设定。　　（2）基于YCrCb的肤色检测，将图像分类存放在不同文件目录下，伪代码如下：　　BEGIN 　　While（ readdir（test_dir）！= NULL）　　{ 　　通过肤色阈值及肤色像素所占比例判断是否为色情图像，返回class_no 　　if（ class_no为1 ）　　将该图像拷贝到NO目录下　　if（ class_no为0 ）　　将该图像拷贝到OK目录下　　} 　　END 　　其中，test_dir为待测图像集所在路径，class_no为图像类别（0为合法，1为非法）。　　（3）基于纹理的肤色检测，将基于YCrCb肤色检测后NO文件里的图像集进一步分类，伪代码如下：　　BEGIN 　　While（ readdir（NO）！= NULL）　　{ 　　通过阈值将图像重构，通过肤色比例判断是否为色情图像，返回class_no 　　if（ class_no为1 ）