- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
填空題
Web挖掘可分為、和3大类。
数据仓库需要统一数据源,包括统一、统一、统一和统一数据特性4个方面。
数据分割一般准時间、、、以及组合措施进行。
噪声数据处理的措施重要有、和。
数值归约的常用措施有、、、和对数模型等。
评价关联规则的2个重要指标是和。
多维数据集一般采用或雪花型架构,以表為中心,连接多种表。
决策树是用作為結点,用作為分支的树构造。
关联可分為简朴关联、和。
BP神经网络的作用函数一般為区间的。
数据挖掘的过程重要包括确定业务对象、、、及知识同化等几种环节。
数据挖掘技术重要波及、和3个技术领域。
数据挖掘的重要功能包括、、、、趋势分析、孤立点分析和偏差分析7个方面。
人工神经网络具有和等特点,其构造模型包括、和自组织网络3种。
数据仓库数据的4个基本特性是、、非易失、随時间变化。
数据仓库的数据一般划分為、、和等几种级别。
数据预处理的重要内容(措施)包括、、和数据归约等。
平滑分箱数据的措施重要有、和。
数据挖掘发現知识的类型重要有广义知识、、、和偏差型知识五种。
OLAP的数据组织方式重要有和两种。
常見的OLAP多维数据分析包括、、和旋转等操作。
老式的决策支持系统是以和驱动,而新决策支持系统则是以、建立在和技术之上。
OLAP的数据组织方式重要有和2种。
SQLServer的OLAP组件叫,OLAP操作窗口叫。
BP神经网络由、以及一或多种結点构成。
遗传算法包括、、3个基本算子。
聚类分析的数据一般可分為区间标度变量、、、、序数型以及混合类型等。
聚类分析中最常用的距离计算公式有、、等。
基于划分的聚类算法有和。
Clementine的工作流一般由、和等节点连接而成。
简朴地說,数据挖掘就是从中挖掘的过程。
数据挖掘有关的名称尚有、、等。
判断題
数据仓库的数据量越大,其应用价值也越大。
啤酒与尿布的故事是聚类分析的经典实例。
等深分箱法使每个箱子的记录个数相似。
数据仓库“粒度”越细,记录数越少。
数据立方体由3维构成,Z轴表达事实数据。
决策树措施一般用于关联规则挖掘。
ID3算法是决策树措施的初期代表。
C4.5是一种经典的关联规则挖掘算法。
回归分析一般用于挖掘关联规则。
人工神经网络尤其适合处理多参数大复杂度问題。
概念关系分析是文本挖掘所独有的。
可信度是对关联规则的精确度的衡量。
孤立点在数据挖掘時总是被视為异常、无用数据而丢弃。
SQLServer不提供关联规则挖掘算法。
Clementine是IBM企业的专业级数据挖掘软件。
决策树措施尤其适合于处理数值型数据。
数据仓库的数据為历史数据,历来不需要更新。
等宽分箱法使每个箱子的取值区间相似。
数据立方体是广义知识发現的措施和技术之一。
数据立方体的其中一维用于记录事实数据。
决策树一般用于分类与预测。
Apriori算法是一种经典的关联规则挖掘算法。
支持度是衡量关联规则重要性的一种指标。
SQLServer集成了OLAP,但不具有数据挖掘功能。
人工神经网络常用于分类与预测。
名詞解释
数据仓库:是一种新的数据处理体系构造,是面向主題的、集成的、不可更新的(稳定性)、随時间不停变化(不一样步间)的数据集合,為企业决策支持系统提供所需的集成信息。
孤立点:指数据库中包括的某些与数据的一般行為或模型不一致的异常数据。
OLAP:OLAP是在OLTP的基础上发展起来的,以数据仓库為基础的数据分析处理,是共享多维信息的迅速分析,是被专门设计用于支持复杂的分析操作,侧重对分析人员和高层管理人员的决策支持。
粒度:指数据仓库的数据单位中保留数据细化或综合程度的级别。粒度影响寄存在数据仓库中的数据量的大小,同步影响数据仓库所能回答查问询題的细节程度。
数据规范化:指将数据按比例缩放(如更换大单位),使之落入一种特定的区域(如0-1)以提高数据挖掘效率的措施。规范化的常用措施有:最大-最小规范化、零-均值规范化、小数定标规范化。
关联知识:是反应一种事件和其他事件之间依赖或互相关联的知识。假如两项或多项属性之间存在关联,那么其中一项的属性值就可以根据其他属性值进行预测。
数据挖掘:从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人們事先不懂得的、但又是潜在有用的信息和知识的过程。
OLTP:OLTP為联机事务处理的缩写,OLAP是联机分析
您可能关注的文档
最近下载
- 高标准农田项目施工部项目管理班子的人员岗位职责工.docx VIP
- 电气二次培训基地继电保护试题库填空题 .pdf VIP
- DeepSeek+AI大模型赋能智能制造数字化工厂供应链大数据解决方案.pptx VIP
- JEDEC JESD85-2001Methods fo 国外国际规范.pdf VIP
- 免疫治疗-(精品课件).ppt VIP
- 赛迪:中国大数据区域发展水平评估报告.docx VIP
- 全国灌溉水有效利用系数测算分析技术指导细则(2024修订版)知识培训.pptx VIP
- 生物化学与基础分子生物学实验智慧树知到课后章节答案2023年下中山大学.docx VIP
- 中考词汇1600分类速记表 (1)(1)(1).pdf VIP
- 全季酒店--香氛设备布点原则.pdf VIP
文档评论(0)