- 1
- 0
- 约1.1万字
- 约 11页
- 2018-10-04 发布于江苏
- 举报
光环大数据--大数据培训知名品牌
常见的大数据术语表_光环大数据数据分析培训
大数据的出现带来了许多新的术语,但这些术语往往比较难以理解。因此,我们
通过本文给出一个常用的大数据术语表,抛砖引玉,供大家深入了解。其中部分
定义参考了相应的博客文章。当然,这份术语表并没有 100%包含所有的术语,
如果你认为有任何遗漏之处,请告之我们。
A
聚合(Aggregation)–搜索、合并、显示数据的过程
算法(Algorithms)–可以完成某种数据分析的数学公式
分析法(Analytics)–用于发现数据的内在涵义
异常检测(Anomalydetection)–在数据集中搜索与预期模式或行为不匹配
的数据项。除了“Anomalies ”, 用来表示异常的词有以下几种:
outliers,exceptions,surprises,contaminants.他们通常可提供关键的可执行
信息
匿名化(Anonymization)–使数据匿名,即移除所有与个人隐私相关的数据
应用(Application)–实现某种特定功能的计算机软件
人工智能(ArtificialIntelligence)–研发智能机器和智能软件,这些智能
设备能够感知周遭的环境,并根据要求作出相应的反应,甚至能自我学习
B
行为分析法(BehaviouralAnalytics)–这种分析法是根据用户的行为如“怎
么做”,“为什么这么做”,以及“做了什么”来得出结论,而不是仅仅针对人物
和时间的一门分析学科,它着眼于数据中的人性化模式
大数据科学家(BigDataScientist)–能够设计大数据算法使得大数据变得
有用的人
大数据创业公司(Bigdatastartup)–指研发最新大数据技术的新兴公司
生物测定术(Biometrics)–根据个人的特征进行身份识别
B 字节(BB:Brontobytes)–约等于1000YB(Yottabytes),相当于未来数字化
光环大数据
光环大数据--大数据培训知名品牌
宇宙的大小。1B 字节包含了27 个0 !
商业智能(BusinessIntelligence)–是一系列理论、方法学和过程,使得数
据更容易被理解
C
分类分析(Classificationanalysis)–从数据中获得重要的相关性信息的
系统化过程;这类数据也被称为元数据(metadata),是描述数据的数据
云计算(Cloudcomputing)–构建在网络上的分布式计算系统,数据是存储于
机房外的(即云端)
聚类分析(Clusteringanalysis)–它是将相似的对象聚合在一起,每类相似
的对象组合成一个聚类(也叫作簇)的过程。这种分析方法的目的在于分析数据间
的差异和相似性
冷数据存储(Colddatastorage)–在低功耗服务器上存储那些几乎不被使用
的旧数据。但这些数据检索起来将会很耗时
对比分析(Comparativeanalysis)–在非常大的数据集中进行模式匹配时,
进行一步步的对比和计算过程得到分析结果
复杂结构的数据(Complexstructureddata)–由两个或多个复杂而相互关联
部分组成的数据,这类数据不能简单地由结构化查询语言或工具(SQL)解析
计算机产生的数据(Computergenerateddata)–如日志文件这类由计算机生
成的数据
并发(Concurrency)–同时执行多个任务或运行多个进程
相关性分析(Correlationanalysis)–是一种数据分析方法,用于分析变量
之间是否存在正相关,或者负相关
客户关系管理(CRM:CustomerRelationshipManagement) –用于管理销售、业
务过程的一种技术,大数据将影响公司的客户关系管理的策略
D
仪表板(Dashboard)–使用算法分析数据,并将结果用图表方式显示于仪表
板中
数据聚合工具(Dataaggreg
原创力文档

文档评论(0)