- 20
- 0
- 约2.28千字
- 约 7页
- 2017-12-07 发布于浙江
- 举报
大数据价值挖掘的难点和重点:非结构化数据处理
大数据价值挖掘的难点和重点:非结构化数据处理大数据分析和应用得到了各个行业的关注,人们试图从大量数据中发现蕴含的模式和规律,进而产生更多的价值,“数据”作为分析对象在这个过程中所起到的作用是决定性的。本文对结构化数据、非结构化数据、数据结构、关系型数据库、实体关系图、数据模型等我们熟悉的概念进行剖析,说明它们之间的联系和区别。指出非结构化数据处理是大数据分析技术的难点和重点,是提升大数据价值挖掘深度的宝剑,在大数据的教学、研究、学习和应用开发中,围绕非结构化数据处理应当成为核心和重点。 数据这个概念对于每个人来说,是再熟悉不过的,我们生活在数据的世界里,在将来智能发达的时代里更是一刻也离不开数据。然而在千变万化的各种数据中,是否存在一些稳定不变的本质?在变化中寻找不变是科学探索的一条重要思维原则。 各种形式的数据可以归结为结构化数据、半结构化数据和非结构化数据三大种类。它们的区别在于数据的表示是否存在预先定义好的数据模型,因此什么是数据模型是深入理解大数据的关键。数据模型是一种抽象模型,用于表达数据含义的构成单元及其它们之间相互关系、数据与现实世界之间的对应关系。 数据模型包括三种相对独立的层次上的模型。 一是物理数据模型,表示了数据在计算机中存储的物理结构,通常是数据库中的分区、表空间、段、文件等。 二是逻辑数据模型,表示了数据在计算机中进行计算处理的逻辑结构,通常是数据表、列、
您可能关注的文档
最近下载
- 丰田工程标准 TSM 0501G塑料成型材料标准试验方法.doc VIP
- 教学课件:急性st段抬高型心肌梗死.pptx
- 移动脚手架安全搭建操作规范.docx VIP
- 拼多多试题Ⅰ:平台规则(共12题).pdf VIP
- 4000m3d印染废水处理工程设计_毕业设计(论文).pdf VIP
- 2025年高考化学试题分类汇编(全国通用)电化学综合(解析版).pdf VIP
- (热门!)ISO 37003-2025组织舞弊控制管理体系——组织舞弊风险管理指南(译-2025).docx VIP
- 2026年山东出版集团有限公司 山东出版传媒股份有限公司招聘流程笔试模拟试题及答案解析.docx VIP
- 2026年法警面试题目及答案.doc VIP
- 2025年人力资源市场趋势分析报告.pdf VIP
原创力文档

文档评论(0)