大数据对天文学研究的影响分析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据对天文学研究的影响分析.doc

大数据对天文学研究的影响分析   2014年7月21日, 中国科学院云南天文台2.4 m光学天文望远镜2014年下半年观测时间正式面向国内外天文学家开放申请。 与以往通过发送电子邮件来提交申请材料不同, 此次观测时间的申请只有一个入口, 即”中国虚拟天文台”. 这个看似微小的变化却意味着我国天文学研究领域一个新时代的到来, 即从传统的工作模式走向泛在融合的信息化时代。   1 数据密集型时代   天文学, 与许多学科类似, 正在信息与计算技术(ICT)等新兴科技的驱动下发生着根本性的变革。 地基和空基的望远镜等观测设施的工作波段已经覆盖了整个电磁波谱(从射电一直到g射线)以及多个非电磁窗口(比如宇宙线、中微子、引力波等), 收集的数据经过规范处理后进入数据库, 为下一步的科学分析做好准备。 天文学数据正在以前所未有的速度从数据量、增长量和复杂性等各方面快速发展。 这些丰富的数据资源大大加深了人类对宇宙的认识。   2019年将正式投入运行的LAMOST光谱巡天望远镜每晚拍摄数万条天体的光谱, 产生20 GB的光谱数据。 地面广角相机阵GWAC每天的观测数据量可达7.4 TB(1 TB=1024 GB)。 “天籁计划”大型射电干涉仪阵列一期96面天线的数据流量为4.8 GB/s, 二期1000面天线的数据流量为3.2 TB/s. 国际上, 大口径全天巡视望远镜(LSST)2018年投入运行后预计每晚可产生15 TB的原始观测数据, 低频射电阵(LOFAR)每秒产生上百千兆字节的科学数据, 一平方千米天线阵(SKA) 整体运行后每秒钟收集的原始观测数据更是高达千万亿字节。 海量而复杂的图像、光谱、星表、时序等数据就像一个深邃的数字宇宙, 为天文学家提供了广阔的挖掘空间。 例如, 通过对收录着数十上百亿天体的多波段巡天数据库的融合来深入研究宇宙的大尺度结构和银河系的精细结构, 在海量数据中借助高级的数据挖掘手段发现稀有和新的天体类型, 在宇宙时标尺度上揭示类星体、星系和星系团的演化, 将大规模数值模拟结果与精细的观测数据进行比对分析等。   天文数据是宝贵的科研资料, 是人类了解和研究宇宙奥秘的第一手素材。 在人类探索宇宙奥秘和自身起源强烈的好奇心驱使下, 随着科学和技术的不断进步, 特别是望远镜设计与制造技术、探测器设计与制造技术、信息与计算技术等的发展, 天文学已经进入海量数据时代, 或者说”大数据”时代。 天文学研究成为一项以数据为中心, 为数据所驱动的科研活动。   驱动这场变革的背后推手除了有不断丰富的数据, 还有互联网带来的便捷的数据访问和资源共享。   现代天文数据库中蕴含的信息内容十分丰富, 档案研究和数据挖掘不仅是必要的而且是必需的。 大多数情况下, 数据的拥有者发掘的信息只是这些数据库科学价值的很小一部分。   与此同时, 数值模拟不再仅仅是理论分析的一种辅助手段, 而变成研究许多复杂现象(比如宇宙大尺度结构的形成与演化、星系间的相互作用、恒星系统的形成)主要乃至唯一的途径, 这些数值模拟程序也产生大量的数据。 换句话说, 理论家不再仅是用公式来表达自己的思想, 还有大量的数据。 实验(观测)和理论都在用大量的数据来推动人类知识的发展。 现代科学与传统科学无论是从量上还是从质上都发生了根本的变化, 成为一门数据驱动的科学, 这就是”第四范式”[1]. 基于数据的科学发现已成为继实验(观测)、理论分析、科学计算之后, 科学发展的另一个重要支柱。   天文学是数据密集型科学的领头羊, 这主要归因于下面3个因素[2]. 首先, 天文学最早采用(某种程度上是发展了)现代数字探测器, 例如CCD和数字相干器, 并把科学计算作为数据处理的手段, 把数值模拟作为一种科研工具。 国际天文学领域中e-Science的文化理念早在20世纪80年代, 在英特网(WWW)和商业数据库诞生之前, 就被培育起来。 天文数据集的体量从最初的千字节到兆字节, 20世纪80年代末发展到千兆字节, 90年代中期到万亿字节, 如今则是千万亿字节。 天文学家早在20世纪80年代初就设计了领域内通用的数据交换标准, 即FITS[3].   第二个重要的因素是美国宇航局(NASA)等空间机构为其空间科学计划建立起一批数据中心, 在一定的保护期后把科学数据向全社会开放共享。 天文学家的这种做法不但推动了数据库和数据管理工具的发展, 也逐渐培育出科学数据开放共享和重复利用的科学文化。 这些数据中心成为今天虚拟天文台的发祥地和重要基础。   第三个重要因素是大型数字巡天计划的出现并成为天文数据的主要来源。 利用照相底片做巡天观测, 通过扫描实现数字化, 这样的传统巡天工作在20世纪90年代便寿终正寝。 传统巡天计划造就了第一个万亿字节量级的天文数据集, 即数字化

文档评论(0)

zhangningclb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档