一种基于属性权值和wk-距离的天体光谱异常特征线挖掘方法.pdf

一种基于属性权值和wk-距离的天体光谱异常特征线挖掘方法.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种基于属性权值和wk-距离的天体光谱异常特征线挖掘方法.pdf

第33卷,第8期 光谱学与光谱分析 2 o1 and 3年8月 SpectroscopySpectralAmlysis August,2013 一种基于属性权值和w七一距离的天体光谱异常特征线挖掘方法 娄圣金,张继福’,杨海峰 太原科技大学计算机科学与技术学院,山西太原030024 摘 要采用信息熵思想,给出一种基于属性权值和m一距离的异常天体光谱特征线挖掘方法,并开发了天 体光谱异常特征线挖掘系统。首先采用信息熵思想计算天体光谱特征线属性权值,从而有效地刻画每条特 征线的重要程度;其次采用邻域半径的剪枝技术,对海量天体光谱特征线数据集约简,删除不可能成为异常 的数据对象,形成一个候选异常数据集;然后根据离候选异常数据中对象之间的偏差,计算m一距离和,并 选取m一距离和较大的前TOP-NN个数据对象作为天文光谱异常特征线数据;最后采用sDSs恒星光谱特 征线数据集,实验和系统运行结果验证了该方法的有效性和可行性。 关键词天体光谱;异常特征线;属性权值;剪枝;m一距离 中图分类号:TP311文献标识码:AⅨ)I:10.3964/j.issn1000-0593(2013)08—2255一04 状来体现。选用其特征线作为光谱数据集的属性,可有效地 引 言 体现光谱数据所包含的重要信息,同时也可有效地降低光谱 数据的维数,并使得挖掘结果的可理解性更强。本研究采用 我国建成的大型天文观测仪器“大天区面积多目标光纤 信息熵思想,给出一种基于属性权值和m一距离的天体光谱 光谱望远镜”(L舢脚),是一架横卧于南北方向的中星仪 异常特征线挖掘方法,在此基础上,采用VC++6.o作为开 式反射施密特望远镜[1],在每个观测夜晚能够采集2~4万发工具,设计与实现了异常天文光谱特征线挖掘系统。 条光谱,预计所观测到的数据量达到4TB。如何从海量天体 光谱数据中,有效地识别未知和特殊天体光谱成为当前研究 1 天体光谱特征线属性权值和嗽一距离 的难点与热点。 目前,天文光谱数据分析主要集中在天文光谱的分类与 1.1天体光谱特征线一性权值 识别,采用的主要方法有:交叉相关分析与主成分分析、人 在不同星体的天体光谱数据中,相同特征线对于度量异 工神经网络、支持向量机、小波变换、贝叶斯统计、粗糙集 常光谱并不是同等重要的,一些特征线会比另一些特征线的 重要程度要高,例如:对0和B类恒星,OⅥ,Ly\\d\\ga特 和概念格等[2_8|。典型的相关工作有:Gulati等给出的一种基 于贝叶斯统计的分类方法,其独特的分类效果发现了以前未 征线流量比较强,但对G和K星,这两条特征线流量较弱。 因此,赋予光谱数据中各特征线一个体现其重要性程度的指 注意到的光谱类型和谱线[23;Weaver等采用了神经元网络 对恒星光谱进行了MK系统分类的识别,针对中低分辨率的 标值,来度量异常光谱更加符合客观实际。参照文献[10], 紫外和光学波段的光谱,分类精度能达到光谱次型L31;刘蓉 天体光谱特征线加权欧氏距离公式定义为 等应用小波分析方法研究了星系光谱的自动识别问题,然而 也一 该方法都是针对流量已定标的光谱,且存在训练样本的选择 慝忑j 和光谱样本较少的问题[4];此外,张继福等针对中低分辨 其中:zn和zⅣ分别是第i和J条天体光谱中的z条特征线取 率,研究了基于约束FP树的恒星光谱数据相关性分析¨“j、 值,其中:特征线的流量与宽度所构成的面积作为该特征线 基于概念格的天体光谱离群数据识别[7’81等。

文档评论(0)

文档精品 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6203200221000001

1亿VIP精品文档

相关文档