基于分类模式树的恒星光谱自动分类.pdfVIP

基于分类模式树的恒星光谱自动分类.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于分类模式树的恒星光谱自动分类

第33卷,第10期 光谱学与光谱分析 2 1 0 3年10月 and October,2013 SpectroscopySpectralAnalysis 基于分类模式树的恒星光谱自动分类方法 赵旭俊,蔡江辉,张继福,杨海峰,马 洋’ 太原科技大学计算机科学与技术学院,山西太原030024 摘要频繁模式是频繁出现在数据集中的模式,在数据挖掘中起着非常重要的作用。针对恒星光谱分类 任务,在频繁模式的基础上,提出一种基于分类模式树的恒星光谱分类规则挖掘方法。首先根据数据库中恒 星光谱各属性出现的频率不同,其在分类中的重要程度也不同的特征,提出一种新的树型结构——分类模 式树,给出了相关概念及其构造方法SSCPTC,然后,将恒星光谱的特征信息映射到分类模式树上,通过采 用自顶向下和自底向上两种模式相结合的方法对分类模式树进行遍历,实现分类规则的提取,同时引入模 式有用度的概念来调整分类规则的数量、提高分类模式树的构造效率;最后采用国家天文台提供的SDSS恒 星光谱作为实验数据,验证了该方法的正确性,而且具有较高的分类正确率。 关键词恒星光谱;分类规则;模式有用度;决策属性 中图分类号:TP311文献标识码:A DOI:10.3964/j.issrr 1000-0593(2013110-2875—04 引 言 出多波段天体数据的随机森林分类算法[1叼;张继福等提出 我国的大型天文观测仪器LAMOST(全称为大天区面积 了约束FP树的天体光谱数据相关性分析系统口1|,其约束条 多目标光纤光谱望远镜),是一架中星仪式反射施密特望远 件只能人为给出,在缺乏相关专家信息的条件下,将退化为 镜[1J。随着LAMOST的落成以及出光,得到的天文观测样最原始的FP树。 本越来越多,天文学“数据雪崩”和“信息爆炸”已经成为亟待 恒星光谱的自动分类一直是天体光谱数据处理的研究热 解决的问题。为了解决天文数据的复杂性、分布性、海量性 点。本文针对如何提高恒星光谱自动分类正确率及分类效率 和多波段性等问题,基于数据库的多波段数据的数据融合和 的问题,在深入研究光谱特征的基础上,给出了恒星光谱分 数据挖掘研究逐渐成为天文学研究的热点之一,同时借助计 类模式树的概念,将恒星光谱特征全部映射到分类模式树 算机,通过融合天文学和模式识别等相关知识,为天文学专 上,通过引入模式有用度,给出了分类模式树的构造方法, 家研究天体的规律,探索宇宙的奥秘提供技术支持就变得十 同时采用自顶向下和自底向上两种模式对分类模式树进行遍 分迫切和必要。从海量恒星光谱中,实现自动分类对研究宇 历,不仅可以实现恒星的自动分类,而且能够对已分类恒星 宙的起源与演化具有重要意义,而分类规则挖掘是解决该问 光谱进行验证。 题有效途径之一。 近年来有关天体光谱的自动分类和自动识别方面的研究 1恒星光谱分类模式树 主要有:刘蓉[2]等应用小波分析方法对星系光谱进行分类, 其不足是该方法是针对流量已定标的光谱;Fang等提出超 假定DB为交易数据库,I={j,,厶,…,L)是交易数 红外对象的定量分类方法[33;Duan等提出使用模版匹配对据库DB中m个事务属性的集合,DB中每一条事务T就是 天体光谱进行分类[4]。赵青等提出基于MapReduce模型实属性集合I中的一组项目子集,即了EI。 现分布式环境下多波段数据融合方法[53;屠良平等提出了一 定义1:模式P定义为11nLn…n厶,L∈J(i=l,2, 种快速搜索超新星光谱的方法,并获得了36条含爆发超新 …,志),该模式的长度为惫。 星的星系光谱侯选[61;吴悦等提出一种贫金属星候选体识别 收稿日期:2013—

文档评论(0)

ranfand + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档