- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
基于多分类支持向量机的图像分割数据分析汇报
1数据集来源及理解
这里的数据集来源于麻省大学的一种视觉小组,并由由其中的CarlaBrodley奉献给UCI数据集。用于训练的实例源于一种包具有7个户外图像的数据库的随机采样成果,这些图像中的各个部分已被手工分类,从而可以创立一种分类器来给其他图像的不一样区域进行分类。
每一种样本实例都由原始图像上某个取样点所在的3x3邻域的RGB值获得,并根据一系列的分析,可得到如下属性:
中心点横坐标(region-centroid-col):取样中心点所在的图像的横坐标;
中心点纵坐标(region-centroid-row):取样中心点所在的图像的纵坐标;
每个样本所含点的数量(region-pixel-count):为9;
低密集度计数(short-line-density-5)指在通过这个区域的在任意方向上的,长度为5的线段当中,有多少条对比度大小要低于或等于5;
高密集度计数(short-line-density-2)指在通过这个区域的在任意方向上的,长度为5的线段当中,有多少条对比度大小要高于5;
横向像素差值的平均(vedge-mean):指在3x3的样本中,所有的左右相邻的两像素亮度之差的绝对值(共有6个)的平均数;
横向像素差值的原则差(vedge-sd):上述像素差值的原则差;
纵向像素差值的平均(hedge-mean):指在3x3的样本中,所有的上下相邻的两像素亮度之差的绝对值(共有6个)的平均数;
纵向像素差值的原则差(hedge-sd):上述像素差值的原则差;
整体亮度的平均数(intensity-mean):亮度按(R+G+B)/3计算(上同),再根据9个点的这些亮度取平均数
红分量平均(rawred-mean):整个样本区域的红分量的平均值
蓝分量平均(rawblue-mean):整个样本区域的绿分量的平均值
绿分量平均(rawgreen-mean):整个样本区域的lan分量的平均值
红色超过量(exred-mean):测量红色多于其他颜色分量的程度,按(2R-(G+B))的公式计算
蓝色超过量(exblue-mean):测量蓝色多于其他颜色分量的程度,按(2B-(G+R))(的公式计算
绿色超过量(exgreen-mean):测量绿色多于其他颜色分量的程度,按(2G-(R+B))的公式计算
HSV空间中的V值平均(value-mean):从RGB到HSV颜色空间的转换是一种三维的非线性转换,这个算法可以在交互式计算机图形学基础教材《FoleyandVanDam》中找到。
HSV空间中的S值平均(satue-mean)
HSV空间中的H值平均(hue-mean)
此外,在这个数据集当中,一种图像的各个部分被提成了7种类别,包括了砖块表面(BRICKFACE),天空(SKY),树叶(FOLIAGE),水泥(CEMENT),窗户(WINDOW),小路(PATH),以及草地(GRASS)。在这些数据集当中,每个类别均提供了30个训练数据和300个测试数据,这两个数据集分别按csv(逗号分隔)的格式储存在segmentation.data和segmentation.test中,此外尚有一种文献segmentation.names储存了这个数据集的阐明。
2措施与思绪
2.1措施理解与简介
LIBSVM是台湾大学林智仁(LinChih-Jen)副专家等开发设计的一种简朴、易用和迅速有效的SVM模式识别与回归的软件包,不仅提供了编译好的可在Windows系列系统的执行文献,并且提供了源代码,以便改善、修改以及在其他操作系统上应用;该软件对SVM所波及的参数调整相对比较少,提供了诸多的默认参数,并提供了交互检查(CrossValidation)的功能。运用这些参数和功能可以处理诸多有关分类与回归的问题,包括C-SVM、ν-SVM、ε-SVR和ν-SVR等问题,也包括了包括基于一对一算法的多类模式识别的问题。
LIBSVM使用的一般环节是:
1)准备训练的数据集,包括每个样本的维数l,每个样本的属性集x,以及每个样本的对应分类编号y;
2)对数据进行简朴的缩放和平移操作来实现数据的归一化;
3)考虑选用核函数,包括线性核,RGF核,多项式核,sigmoid核等;
4)采用交叉验证选择最佳损失参数C与最合适的gamma系数;
5)采用最佳参数C与gamma系数对整个训练集进行训练获取支持向量机模型;
6)运用获取的模型进行测试。
LibSVM是以源代码和可执行文献两种方式给出的。假如是Windows系列操作系统,可以直接使用软件包提供的程序,也可以进行修改编译。
使用软件包提供的程序时,该软件使用的训练数据和检查数据
文档评论(0)