- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据架构和模式(三)理解大数据解决方案的架构层概要
大数据架构和模式(三)理解大数据解决方案的架构层
摘要:大数据解决方案的逻辑层可以帮助定义和分类各个必要的组件,大数据解决方案需要使用这些组件来满足给定业务案例的功能性和非功能性需求。这些逻辑层列出了大数据解决方案的关键组件,包括从各种数据源获取数据的位置,以及向需要洞察的流程、设备和人员提供业务洞察所需的分析。
概述
这个 “大数据架构和模式” 系列的 第 2 部分 介绍了一种评估大数据解决方案可行性的基于维度的方法。如果您已经使用上一篇文章中的问题和提示分析了自己的情况,并且已经决定开始构建新的(或更新现有的)大数据解决方案,那么下一步就是识别定义项目的大数据解决方案所需的组件。
大数据解决方案的逻辑层
逻辑层提供了一种组织您的组件的方式。这些层提供了一种方法来组织执行特定功能的组件。这些层只是逻辑层;这并不意味着支持每层的功能在独立的机器或独立的进程上运行。大数据解决方案通常由以下逻辑层组成:
1. 大数据来源
2. 数据改动 (massaging) 和存储层
3. 分析层
4. 使用层
? 大数据来源:考虑来自所有渠道的,所有可用于分析的数据。要求组织中的数据科学家阐明执行您需要的分析类型所需的数据。数据的格式和起源各不相同:
o 格式— 结构化、半结构化或非结构化。
o 速度和数据量— 数据到达的速度和传送它的速率因数据源不同而不同。
o 收集点— 收集数据的位置,直接或通过数据提供程序,实时或以批量模式收集数据。数据可能来自某个主要来源,比如天气条件,也有可能来自一个辅助来源,比如媒体赞助的天气频道。
o 数据源的位置— 数据源可能位于企业内或外部。识别您具有有限访问权的数据,因为对数据的访问会影响可用于分析的数据范围。
? 数据改动和存储层:此层负责从数据源获取数据,并在必要时,将它转换为适合数据分析方式的格式。例如,可能需要转换一幅图,才能将它存储在 Hadoop Distributed File System (HDFS) 存储或关系数据库管理系统 (RDBMS) 仓库中,以供进一步处理。合规性制度和治理策略要求为不同的数据类型提供合适的存储。
? 分析层:分析层读取数据改动和存储层整理 (digest) 的数据。在某些情况下,分析层直接从数据源访问数据。设计分析层需要认真地进行事先筹划和规划。必须制定如何管理以下任务的决策:
o 生成想要的分析
o 从数据中获取洞察
o 找到所需的实体
o 定位可提供这些实体的数据的数据源
o 理解执行分析需要哪些算法和工具。
? 使用层:此层使用了分析层所提供的输出。使用者可以是可视化应用程序、人类、业务流程或服务。可视化分析层的结果可能具有挑战。有时,看看类似市场中的竞争对手是如何做的会有所帮助。
每一层包含多种组件类型,下面将会介绍这些类型。
图 1. 逻辑和垂直层的组件
大数据来源
此层包含所有必要的数据源,提供了解决业务问题所需的洞察。数据是结构化、半结构化和非结构化的数据,而且来自许多来源:
? 企业遗留系统— 这些系统是企业应用程序,执行业务需要的分析并获取需要的洞察:
o 客户关系管理系统
o 结算操作
o 大型机应用程序
o 企业资源规划
o Web 应用程序开发
Web 应用程序和其他数据来源扩充了企业拥有的数据。这些应用程序可使用自定义的协议和机制来公开数据。
? 数据管理系统 (DMS)— 数据管理系统存储逻辑数据、流程、策略和各种其他类型的文档:
o Microsoft? Excel? 电子表格
o Microsoft Word 文档
这些文档可以转换为可用于分析的结构化数据。文档数据可公开为领域实体,或者数据改动和存储层可将它转换为领域实体。
? 数据存储— 数据存储包含企业数据仓库、操作数据库和事务数据库。此数据通常是结构化数据,可直接使用或轻松地转换来满足需求。这些数据不一定存储在分布式文件系统中,具体依赖于所处的上下文。
? 智慧设备— 智慧设备能够捕获、处理和传输使用最广泛的协议和格式的信息。这方面的示例包括智能电话、仪表和医疗设备。这些设备可用于执行各种类型的分析。绝大多数智慧设备都会执行实时分析,但从智慧设备传来的信息也可批量分析。
? 聚合的数据提供程序— 这些提供程序拥有或获取数据,并以复杂的格式和所需的频率通过特定的过滤器公开它。每天都会产生海量的数据,它们具有不同的格式,以不同的速度生成,而且通过各种数据提供程序、传感器和现有企业提供。
? 其他数据源— 有许多数据来自自动化的来源:
o 地理信息:
o 地图
o 地区详细信息
o 位置详细信息
o 矿井详细信息
o 人类生成的内容:
o 社交媒体
o 电子邮件
o 博客
o 在线信息
o 传感器数据:
o 环境:天气、降雨量、湿度
您可能关注的文档
最近下载
- Q开关Nd YAG激光治疗机临床应用参考资料.doc VIP
- 空杯心态培训.ppt VIP
- 2025数字低空网络架构白皮书.pdf VIP
- 2024年福建省厦门市城市管理行政执法局招聘历年【综合基础知识500题】高频考点模拟试题及参考答案解析.docx VIP
- KL-M型Q开关Nd:YAG激光治疗机临床资料.doc VIP
- 福建省龙岩市2024-2025学年高一下学期期末考试 数学试卷含答案.pdf VIP
- 国产Q开关Nd-YAG双波长脉冲激光联合迪维霜治疗雀斑疗效观察.doc VIP
- 幸福生活从感恩开始_‘感恩心态’培训.pptx VIP
- 感恩心态培训.pptx VIP
- Q开关Nd-YAG激光治疗文身护理体会.doc VIP
文档评论(0)