- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于内容的图像垃圾邮件检测与过滤方法
摘要:随着人们对电子邮件的依赖性越来也高,垃圾邮件的过滤已经成为了目前亟须重视和解决的问题。自从图像垃圾邮件出现后,已经有一些学者对其过滤方法进行了研究,并且也取得了一定的成果,本文主要以特征提取来过滤图像垃圾邮件进行阐述。
关键词:基于内容的图像;垃圾邮件;检测与过滤
中图分类号:TP391.41 文献标识码:A文章编号:1007-9599 (2011) 17-0000-02
Content-based Image Spam Detection and Filtering
Shu Hong,Zhang Rui
(Guiyang College,Guiyang550005,China)
Abstract:As people increasingly dependent on e-mail is also high,spam filtering has become an urgent need to pay attention to solving the current problems.Since the emergence of image spam,some scholars have conducted a study of its filtering,and also achieved some results,this paper to the image feature extraction to filter spam elaborate.
Keywords:Content-based image;Spam;Detection and filtering
引言:电子邮件作为一种简单又方便的通信方式,已经获得了巨大的普及,受到了人们的青睐。于此同时,大量的垃圾邮件不断地产生,威胁着正常的电子邮件交流。为了过滤这些垃圾邮件,近些年来,已经有很多中方法被开发出来,利用具体特征来识别图像垃圾邮件。
一、基于内容的图像垃圾邮件检测
(一)基于颜色特征的检测
在图像检索中应用最广泛的就属基于颜色特征的检测,它与图像中包含的物体或场景关系密切。由于颜色对图像的属性变化不敏感,因此,对于图像中对象的局部特征的捕捉,颜色特征很难实现。另外,如果数据库很大,仅仅使用颜色特征查询,所检索出来的图像常常包括一些不需要的图像。在传统的注重几何特征的计算机视觉研究中,基于颜色的检索中颜色不一定会得到重视,颜色不是刻画一个物体的关键特征,这是人们普遍的观点。在检索过程中,直方图和二值向量是颜色的表征描述的两种方法。直方图主要是对图像颜色的空间分布进行描述,二值向量主要是对图像的特征元素进行描述。Mahalanobis距是一种很有前途的相似性度量手段。用Mahalanobis距来进行相似度的比较:
设 ,其中随机变量的y均值由E{y}来表示。那么协方差矩阵 可由下式给出:
,其中 ……(1)
设 Mahalanobis距可以表示为
…… (2)
在特定的条件下, 既具有统计独立性又具有不均衡的方差,此时Mahalanobis距可以简化为
…… (3)
如果 不具有统计独立性,那么为了让其具有统计独立性,可以通过坐标转换实现,此时解决此问题就可以将其看作是一般的特征值问题进行。令 ,然后就有 ,从而Mahalanobis距可以表示为
……(4)
(二)基于形状特征的检测
图像中物体的一个显著特征就是形状特征,同一种物体颜色可能多样,因此,在查询时可能并不针对图像的颜色,但其形状基本相似。例如,对某辆汽车的图像进行检索,汽车的颜色有很多种,但是一款汽车的形状都是类似的。对于图形来说,它的唯一重要的特征就是形状。轮廓就是指从图像中提取的目标边缘。在基于内容检索中一个重要方面就是基于形状或轮廓的检索,它从图像库中检索出形状相似的图像主要是用户通过勾勒图像的形状或轮廓。
目标的边缘从图像中进行提取,基于形状的图像检索的一个重要技术就是获取目标的轮廓。可以采用圆形度、矩形度、形状描述等来表征物体的形状。通过获得图像多尺度下的不变矩,基于小波变换的图像检索得到图像的一组特征,并将其组合起来,共同构成物体的特征向量。归一化特征向量,等到获得物体的归一化特征向量,他们的相似度就可以采用两幅图像的归一化特征向量的欧氏距离,从而实现图像的检索。基于形状的图像检索利用小波分析得到,其具有更好的图像检索效果。
设在整个平面上 的积分值为1,且它在x或y为无限远处收敛为0,则定义 为二维平滑函数。此时,将两个小波函数 和 定义好。
…… (5)
……(6)
这样
文档评论(0)