- 2
- 0
- 约4.26千字
- 约 9页
- 2017-11-28 发布于福建
- 举报
基于特征聚类文化遗产图像管理应用探究
基于特征聚类文化遗产图像管理应用探究 摘要:基于特征的聚类研究已渗透到各行各业。文章结合贵州民族文化特色,研究了文化遗产的数字化保护特点,继而阐述模式识别、MATLAB特征提取图像的色彩、纹理、形状等特征,并根据这些特征进行多阶段算法聚类分析,最后结合数据挖掘技术对文化遗产数字化管理作出展望。
关键词:模式识别;特征提取;聚类分析;数字化管理
中图分类号:TP391 文献标识码:A 文章编号:1009-2374(2013)25-0159-03
大数据时代渐渐到来,如何从海量数据中获取有价值的信息,进而有效管理和利用信息,是当今工程领域研究的热点。在贵州省文化遗产数字化保护过程中,蜡染、刺绣、银饰等民族民间工艺品大量涌现;苗音组合、侗族大歌等民族音乐形式百花齐放;这些数以万计的多媒体信息,需要采用先进计算机辅助手段进行类别划分,从而提供后续的支撑与分析服务,以推动贵州文化遗产数字化保护与民族文化旅游产业发展。
基于特征的聚类分析是根据图像的数字特征把数据划分为某些类别,它主要考虑同一类内的数据彼此相似,不同类的数据彼此分开,进而有效管理数据、分析现象。本文通过对提取方式和聚类算法的比较介绍和运用,以数据挖掘的视角阐述特征聚类在文化遗产领域的推广运用。
1 数据准备与特征选择
1.1 图像的采集
图像采集是一项系统化工程,包括前期规划、中期控制、后期处理等,采集图像的方式和质量的好坏直接关系到后续算法生成效果。
目前,我们获取数字化图像的主要方式是:单反相机+2D扫描仪+3D扫描仪、摄像机+CF卡等。拍摄方式会有限制,例如场景宏大约束、噪点控制等,本文涉及图像质量较高,在拍摄图像时使用三脚架定点拍摄。考虑到摄像机的成像质量与采集成本的性价比,已渐渐使用单反摄像
取代。
1.2 文化遗产图形图像特点
文化遗产的图形图像边缘性强,颜色对比度与灰度值特征易于表达,不仅有花纹信息,还有形状、色度等其他视觉信息,作品的色泽、线条、构图、装饰等特征也各不相同。不同类别作品图像中提取出的图像特征不尽相同,而同类别图像的特征应具有相似性,可作为作品聚类的依据。
1.3 特征的选择
一般图像特征可分为四类:颜色特征、纹理特征、形状特征、空间关系特征。
1.3.1 颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。颜色直方图是最常用的表达颜色特征的方法,其优点是不受图像旋转和平移变化的影响,进一步借助归一化还可不受图像尺度变化的影响。
1.3.2 纹理特征与颜色特征不同,纹理特征需要在包含多个像素点的区域中进行统计计算。在模式匹配中,这种区域性的特征不会由于局部的偏差而无法匹配成功,对于噪声有较强的抵抗能力。但缺点是当图像的分辨率变化时,所计算出来的纹理可能会有偏差。
1.3.3 许多形状特征仅描述了目标局部的性质,要全面描述目标常对计算时间和存储量有较高的要求;形状特征表示方法,一类是轮廓特征,另一类是区域特征。图像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域。
1.3.4 空间关系是指图像中分割出来的多个目标之间的相互的空间位置或相对方向关系。通常分为:相对空间位置信息和绝对空间位置信息。由绝对空间位置可推出相对空间位置,表达相对空间位置信息比较简单。空间关系特征的使用可加强对图像内容的描述区分能力,但空间关系特征常对图像或目标的旋转、尺度变化等比较敏感。
实际应用中,文化遗产图像大都具有较为规范的几何形状,人为控制也保障了较少的杂质,考虑到算法复杂度与聚类精度,选取颜色、纹理两种有效的特征,存储于向量中,并使用空间关系特征与其他特征来配合。
2 特征提取方法与过程
2.1 图像预处理
对单个图像的特征进行提取,首先就需要对图像进行预处理,以此来对图像中的噪声进行过滤,尽可能对图像中的有效信息予以保留。预处理一些具体的方法如:直方图均衡化、非线性的统计滤波器、拉普拉斯增强算子、高斯低通滤波器等。
2.2 色彩空间与色彩特征提取
色彩空间是在某些标准下用通常可接受的方式简化色彩规范。色彩模型通常可以用坐标系统来描述。目前广泛使用的色彩模型是RGB(红、绿、蓝)模型、HSV模型、YUV模型、YIQ模型等。
2.2.1 RGB模型。
RGB模型是通过红、绿、蓝3个颜色亮度的变化以及它们相互之间叠加来得到各种各样的颜色,该标准几乎包括了人类视觉所能感知的所有颜色,目前运用最广。
MATLAB中,每一个像素都在特定空间位置的彩色图像中对应红、绿、蓝3个分量。提取命令为:
PR=RGB_image(:,:,1);
PG=R
原创力文档

文档评论(0)