网站大量收购独家精品文档,联系QQ:2885784924

大数据量交叉证认算法研究-China-VO.ppt

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据量交叉证认算法研究-China-VO

11/29-12/03 China-VO 2006, Guilin 内容 星表介绍 交叉证认的意义 现有的交叉证认工具 交叉证认概念 交叉证认方法比较 B-tree索引 HTM索引 HTM索引分区+kdtree 进一步工作 星表 星表是包含天体信息(如赤经、赤纬、星等、流量)的二维数据表格 多波段:光学、红外、射电、X射线等 星表的每一行对应一个天体,不同星表的同一天体的共同属性是位置信息 赤经:0~360度 赤纬:-90~90度 星表实例 交叉证认的必要性 多波段数据急剧增长 革命性步骤:数据融合 联系桥梁:位置交叉证认 交叉证认的意义 多波段数据融合,获得天体多波段信息 对天体的物理性质、演化规律获得更全面系统的认识 为进一步的统计分析、数据挖掘做准备 提取天体的参数越多,越有利于天体分类和测光红移的计算 增加了发现新天体的概率 LAMOST三大核心子课题之一 虚拟天文台数据融合必由之路 现有的交叉证认工具 SIMBAD ALADIN NED MAST TOPCAT OpenSkyquery GVO-cross-match 现有工具的优缺点 优点: 界面友好 数据资源丰富 缺点: 不能进行大样本的交叉证认 参数不能自由选择 交叉证认结果需要用户进一步加工 没有对结果进行分类 没给出交叉证认的概率 只能与特定的数据交叉证认 交叉证认的概念 将不同星表或数据库中的源按位置属性将它们联系起来,在相同位置的源或一定误差半径范围内的源,被证认为是同一天体。 证认的判断方法 证认的判断方法(例子) 2MASS:r1=0.1 ra=357.661036243116, decl=0.434507548194 SDSS:r2=0.1 ra=357.661059, decl=0.434484 d:0.000032746961 两个源满足(1)式,被证认为同一个天体 索引 Indexing mechanisms used to speed up access to desired data. B-tree索引的交叉证认 为星表的ra,decl两列建B-tree索引 以小表为中心,在大表中遍历寻找证认源 以(1)式为判断 算法复杂度O(N*N) B-tree索引的交叉证认(续) B-tree索引方法优缺点 优点: 证认精度高 缺点: 内存限制,索引不好 速度慢,算法复杂度高 HTM The Spatial Index is a quad tree of spherical triangles. The tree is built in the following way: Start out with 8 triangles on the sphere using the 3 main circles to determine them. Then, every triangle can be decomposed into 4 new triangles by drawing main circles between midpoints of its edges HTM pcode HTM level Level Area (arcmin^2) Num Leaves 10 1.77E1 8,388,608 11 1.43E0 33,554,432 12 1.11E01 34,217,728 13 2.77E-1 536,870,912 14 6.92E-2 2,147,483,648 15 1.73E-2 8,589,934,592 20 1.69E-5 8,796,093,022,208 25 1.65E-8 9,007,199,254,740,922 HTM索引的交叉证认 由星表的精度选取一定的HTM级数 由星表的ra,decl计算出HTM pcode值 两个B-tree索引 一个空间索引 N*N遍历 自然连接 省去(1)式判断,要求两个星表级数一样,即精度差不多 HTM索引的交叉证认(续) HTM索引方法优缺点 优点: 索引好,空间索引解决了内存限制问题 缺点

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档