- 15
- 0
- 约1.29万字
- 约 17页
- 2017-01-15 发布于重庆
- 举报
2014知识发现与数据开采试题及答案
什么叫数据挖掘?数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程。数据挖掘一般有哪些步骤?从数据本身来考虑,数据挖掘通常需要有信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘实施过程、模式评估和知识表示8个步骤。步骤(1)信息收集:根据确定的数据分析对象,抽象出在数据分析中所需要的特征信息,然后选择合适的信息收集方法,将收集到的信息存入数据库。对于海量数据,选择一个合适的数据存储和管理的数据仓库是至关重要的。步骤(2)数据集成:把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。步骤(3)数据规约:如果执行多数的数据挖掘算法,即使是在少量数据上也需要很长的时间,而做商业运营数据挖掘时数据量往往非常大。数据规约技术可以用来得到数据集的规约表示,它小得多,但仍然接近于保持原数据的完整性,并且规约后执行数据挖掘结果与规约前执行结果相同或几乎相同。步骤(4)数据清理:在数据库中的数据有一些是不完整的(有些感兴趣的属性缺少属性值)、含噪声的(包含错误的属性值),并且是不一致的(同样的信息不同的表示方式),因此需要进行数据清理,将完整、正确、一致的数据信息存入数据仓库中。不然,挖掘的结果会差强人意。步骤(5)数据变换:通过平滑聚集、数据概化、规范化等方式将数据转换成适用于数据挖掘的
您可能关注的文档
最近下载
- 贵州省遵义市播州区2026年中考语文一模试卷(含答案).pdf VIP
- 2024年广东省佛山市南海区、三水区初中毕业生适应性学业检测地理试卷.pdf VIP
- 怀化中考乡土地理真题及答案2025.doc VIP
- 超限梁板模板工程专项施工方案.pdf VIP
- 麦克维尔螺杆冷水机组维修保养手册.doc VIP
- 脚手架动态监测技术方案.docx
- 24陆上风力发电工程施工工艺标准手册(2025年版).docx VIP
- 2023年《全国碘缺乏病监测方案》.pdf VIP
- 2024年福建省福州市中考语文试卷真题(含标准答案及解析).docx
- 12CJ35 珍珠岩吸声板吊顶与墙面构造-崔申珍珠岩吸声板.pdf VIP
原创力文档

文档评论(0)