时间片数据采集单元 - 计算机应用研究室.ppt

下载文档 降价啦

1
0
约3.85千字
约 21页
2017-08-16 发布于天津
举报
版权申诉
保障服务

时间片数据采集单元 - 计算机应用研究室.ppt

1、本文档共21页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

数据采集与框架报告人黄文君导师王华忠提要数据采集介绍分布式概述待解决的问题数据采集介绍数据采集流程物理模型数据采集系统由数据采集控制系统数据采集系统和数据服务系统三个部分组成各系统之间通过以太网络连接进行控制参数和实验数据的传递和交互结采集影响因子灵活性一部分的诊断信号通过屏蔽电缆送入采集机房经隔离和放大处理后再输入数据采集单元采集另一部分诊断信号要求短距离传输对这些信号进行采集这些信号从装置的传感器出来经过放大器然后由现场采集系统进行采集如近道较微弱的软射线信号可靠性和实时性对于各重要诊断信号

Event Name Here BEA Confidential 数据采集与Hadoop框架报告人：黄文君导师：王华忠 2011-11-11 提要：数据采集介绍分布式Hadoop概述待解决的问题 QA 数据采集介绍数据采集流程 ——物理模型数据采集系统由数据采集控制系统、数据采集系统和数据服务系统三个部分组成各系统之间通过以太网络连接，进行控制参数和实验数据的传递和交互结。采集影响因子灵活性一部分的诊断信号通过屏蔽电缆送入采集机房，经隔离和放大处理后再输入数据采集单元采集；另一部分诊断信号要求短距离传输，对这些信号进行采集这些信号从EAST装置的传感器出来，经过放大器，然后由现场采集系统进行采集（如近60道较微弱的软X射线信号）可靠性和实时性对于各重要诊断信号的变化情况，需要实时获取，以便对控制系统相应参数进行调整，从而维持等离子体平衡，获得理想的放电结果准确性根据采样定理，要使信号不失真，采样周期不能大于信号周期的一半，所以采样频率至少是信号频率两倍。为了提高准确性，有时需要高达10倍，20倍数据采集控制系统时间片数据采集单元 --问题研究数据采集单元在硬件上由相对独立的计算机和数据采集卡；在软件上由不同的操作系统和数据采集软件系统组成长脉冲采集面临的问题：采集，压缩，传输，存储对采集卡内存数据分析与可视化软件都是将实验数据获取到本机内存中进行分析和处理数据发布速度要求单通道采集频率250KHz的信号，持续采集1000s信号文件为500MB，压缩后信号文件约为200MB，以最高速度获取10道数据所需的时间约为，时间片机制（Ts=5秒时间片进行划分，采集程序针对5s的时间片在计算机内存中开辟了三块的内存区域，前两块为循环缓冲的两个分区DataBuf1和DataBuf2，后一块为传输缓冲TransBuf。）数据服务系统（lzo存储）存储：以文件方式将数据分布存储于多台基于Linux平台的数据服务器中，并通过建立索引服务器来定位数据文件的位置。部分信号还将通过中间件转存到MDSplus服务器或送入二级库服务器进行计算，供物理人员分析诊断。 Hadoop框架 Hadoop框架 Hadoop框架理论基础 Google GFS文件系统: 一个面向大规模数据密集型应用的、可伸缩的、高度容错网络化的分布式文件系统。，主要chunkserver是由一个master（主）和众多chunkserver（大块设备）构成的。 Bigtable: Google的分布式的结构化数据存储系统，用户可以动态的控制数据的分布和格式多级映射的数据结构结构上分为两部分：其一是Master节点，支持负载均衡。其二是Tablet节点，存储数据库的分片tablet，并提供相应的数据访问，对压缩有很好的支持。 MapReduce：一个编程模型，也是一个处理和生成超大数据集的算法模型的相关实现。程序开发者不需要像普通并行程序开发（共享内存模型和网络互联模型）设置barrier节点 Hadoop架构 HDFS文件系统 Namenode和Datanode Namenode:是所有HDFS元数据的仲裁者和管理者。执行文件系统的名字空间操作，比如打开、关闭、重命名文件或目录。也负责确定数据块到具体Datanode节点的映射。 Namenode管理文件系统的元数据， Datanode真正处理文件系统客户端的读写请求。在Namenode的统一调度下进行数据块的创建、删除和复制。Datanode存储了实际的数据 Namenode从所有的 Datanode接收心跳信号和块状态报告。块状态报告包括了某个Datanode所有的数据块列表。优势保证副本机制(默认，副本系数是3：本地节点，同一机架的另一个节点上，不同机架的节点上) 机架感知(rack-aware)策略：提高数据的可靠性、可用性和网络带宽的利用率 EditLog事务日志 (edits)、FsImage的文件和检查点(checkpoint)) 文件和目录的权限模型 Map/Reduce模型 Example DistCp（分布式拷贝）是用于大规模集群内部和集群之间拷贝的工具。它使用Map/Reduce实现文件分发，错误处理和恢复，以及报告生成。它把文件和目录的列表作为map任务的输入，每个任务会完成源列表中部分文件的拷贝。这些拷贝工作被分配给多个map任务，然后每个TaskTracker分别执行从nn1到nn2的拷贝操作每个TaskTracker必须都能够与源端和目的端文件系统进行访问和交互。待解决的问题如何解决工控机的瓶颈除了分片采集，是不是还有其他的采集方式？（间歇采样，变频采