- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
大数据可视化理论及技术
(一)大数据可视分析综述
可视分析是大数据分析的重要方法。大数据可视分析旨
在利用计算机自动化分析能力的同时,充分挖掘人对于可视
化信息的认知能力优势,将人、机的各自强项进行有机融合,
借助人机交互式分析方法和交互技术,辅助人们更为直观和
高效地洞悉大数据背后的信息、知识与智慧。主要从可视分
析领域所强调的认知、可视化、人机交互的综合视角出发,
分析了支持大数据可视分析的基础理论,包括支持分析过程
的认知理论、信息可视化理论、人机交互与用户界面理论。
在此基础上,讨论了面向大数据主流应用的信息可视化技术
——面向文本、网络(图)、时空、多维的可视化技术。同时
探讨了支持可视分析的人机交互技术,包括支持可视分析过
程的界面隐喻与交互组件、多尺度/多焦点/多侧面交互技
术、面向Post-WIMP的自然交互技术。最后,指出了大数据
可视分析领域面临的瓶颈问题与技术挑战。
(二)大数据分析工具
大数据是一个含义广泛的术语,是指数据集,如此庞大
而复杂的,他们需要专门设计的硬件和软件工具进行处理。
该数据集通常是万亿或EB的大小。这些数据集收集自各种
各样的来源:传感器,气候信息,公开的信息,如杂志,报
纸,文章。大数据产生的其他例子包括购买交易记录,网络
日志,病历,军事监控,视频和图像档案,及大型电子商务。
在大数据和大数据分析,他们对企业的影响有一个兴趣
高涨。大数据分析是研究大量的数据的过程中寻找模式,相
关性和其他有用的信息,可以帮助企业更好地适应变化,并
做出更明智的决策。大数据分析的常用工具通常有以下介绍
的几种。
4.2.1Hadoop
Hadoop是一个能够对大量数据进行分布式处理的软件框
架。但是Hadoop是以一种可靠、高效、可伸缩的方式进行
处理的。Hadoop是可靠的,因为它假设计算元素和存储会失
败,因此它维护多个工作数据副本,确保能够针对失败的节
点重新分布处理。Hadoop是高效的,因为它以并行的方式工
作,通过并行处理加快处理速度。Hadoop还是可伸缩的,能
够处理PB级数据。此外,Hadoop依赖于社区服务器,因此
它的成本比较低,任何人都可以使用。
Hadoop带有用Java语言编写的框架,因此运行在Linux
生产平台上是非常理想的。
Hadoop上的应用程序也可以使用其他语言编写,比如
C++。
4.2.2HPCC
HPCC,HighPerformanceComputingand
Communications(高性能计算与通信)的缩写。1993年,由美
国科学、工程、技术联邦协调理事会向国会提交了“重大挑
战项目:高性能计算与通信”的报告,也就是被称为HPCC
计划的报告,即美国总统科学战略项目,其目的是通过加强
研究与开发解决一批重要的科学与技术挑战问题。HPCC是美
国实施信息高速公路而上实施的计划,该计划的实施将耗资
百亿美元,其主要目标要达到:开发可扩展的计算系统及相
关软件,以支持太位级网络传输性能,开发千兆比特网络技
术,扩展研究和教育机构及网络连接能力。
该项目主要由五部分组成:
高性能计算机系统(HPCS),内容包括今后几代计算机系
统的研究、系统设计工具、先进的典型系统及原有系统的评
价等;
先进软件技术与算法(ASTA),内容有巨大挑战问题的软
件支撑、新算法设计、软件分支与工具、计算计算及高性能
计算研究中心等;
国家科研与教育网格(NREN),内容有中接站及10亿位级
传输的研究与开发;
基本研究与人类资源(BRHR),内容有基础研究、培训、
教育及课程教材,被设计通过奖励调查者-开始的,长期的
调查在可升级的高性能计算中来增加创新意识流,通过提高
教育和高性能的计算训练和通信来加大熟练的和训练有素
的人员的联营,和来提供必需的基础架构来支持这些调查和
研究活动;
信息基础结构技术和应用(IITA),目的在于保证美国在
先进信息技术开发方面的领先地位。
HighPerformanceComputingCluster(HPCC)
BigExtractionTransfoymationLoading
您可能关注的文档
- 中考语文试题研究题库(记叙文15篇 答案) .pdf
- 2022汽车修理工(技师)考试题库 .pdf
- 大数据开发基础(习题卷79) .pdf
- 底盘选择题总集 .pdf
- 2022年体育中考基本知识理论考试常见试题集附答案 .pdf
- 2023年汽车底盘测量及车轮定位系统题库 .pdf
- 押题宝典教师资格之中学信息技术学科知识与教学能力题库练习试卷A.pdf
- 全国教师资格考试(面试)高中体育经典教案【范文模板】 .pdf
- 体育基础知识选择题 .pdf
- (更新版)国家开放大学电大本科《科学与技术》简答论述题题库及答案.pdf
- 四川省德阳市罗江中学2025届高三考前热身化学试卷含解析.doc
- 山东省枣庄现代实验学校2025届高三下学期第五次调研考试化学试题含解析.doc
- 吉林省长春市十一高中等九校教育联盟2025届高三一诊考试生物试卷含解析.doc
- 2025届江苏省盐城市伍佑中学高考仿真模拟化学试卷含解析.doc
- 2025届广西贺州中学高考冲刺押题(最后一卷)生物试卷含解析.doc
- 安徽省池州市贵池区2025届高三第一次模拟考试生物试卷含解析.doc
- 宁夏银川一中2025届高三(最后冲刺)化学试卷含解析.doc
- 广东省广州市增城区四校联考2025届高考压轴卷化学试卷含解析.doc
- 2025届邯郸市第一中学高考生物必刷试卷含解析.doc
- 2025届安徽省安庆市石化第一中学高考仿真卷化学试卷含解析.doc
最近下载
- 山东省泰安市泰山区2023-2024学年上学期期中考试七年级英语试题.docx VIP
- 财务管理实务 财务管理实务 实训指导书.doc
- 2024年新人教版九年级上册化学全册教案.docx
- 上海通用汽车GVDP整车开发流程.pdf VIP
- 苏教版四年级上册同步奥数培优 第十四讲 智巧问题.pdf VIP
- 2024年江苏省苏州高新区招聘“两新”组织党建专职党务工作者6人历年【综合基础知识500题】高频考点模拟试题及参考答案解析.docx VIP
- 2024年武汉市东湖生态旅游风景区管理委员会公开招聘机关派遣制工作人员9人笔试备考试题及答案解析.docx VIP
- 人教版普通高中地理选择性必修2区域发展.pdf
- 人体解剖学常考重要知识点.doc
- 2023年江苏苏州相城区招考聘用两新组织党建专职党务工作者23人笔试历年难易错点考题荟萃附带答案详解.docx VIP
文档评论(0)