- 29
- 1
- 约小于1千字
- 约 2页
- 2020-11-10 发布于浙江
- 举报
结构化数据、半结构化数据和非结构化数据
结构化数据
结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。举一个例子:
id name age gender
1 lyh 12 male
2 liangyh 13 female
3 liang 18 male
所以,结构化的数据的存储和排列是很有规律的,这对查询和修改等操作很有帮助。但是,显然,它的扩展性不好(比如,我希望增加一个字段,怎么办?)。
半结构化数据
半结构化数据是结构化数据的一种形式,它并不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。因此,它也被称为自描述的结构。
半结构化数据,属于同一类实体可以有不同的属性,即使他们被组合在一起,这些属性的顺序并不重要。
常见的半结构数据有XML和JSON,对于对于两个XML文件,第一个可能有
person
nameA/name
age13/age
genderfemale/gender
/person
第二个可能为:
person
nameB/name
gendermale/gender
/person
从上面的例子中,属性的顺序是不重要的,不同的半结构化数据的属性的个数是不一定一样的。有些人说半结构化数据是以树或者图的数据结构存储的数据,怎么理解呢?上面的例子中,person标签是树的根节点,name和gender标签是子节点。通过这样的数据格式,可以自由地表达很多有用的信息,包括自我描述信息(元数据)。所以,半结构化数据的扩展性是很好的。
非结构化数据
顾名思义,就是没有固定结构的数据。各种文档、图片、视频/音频等都属于非结构化数据。对于这类数据,我们一般直接整体进行存储,而且一般存储为二进制的数据格式。
您可能关注的文档
最近下载
- 曲靖市会泽县2025年初中数学毕业考试模拟冲刺卷含解析.docx VIP
- 2022年内蒙古大学自考英语(二)练习题汇总(附答案解析).pdf VIP
- 中国八大菜系形成历程和背景.ppt VIP
- 古诗词三百首--行书钢笔字帖(A4纸打印).pdf VIP
- 新12J07室外工程-标准图集.docx VIP
- 2026年高考英语作文高级句型模板:议论文+应用文+写作框架+替换词汇+范文-(2).docx VIP
- 循环水、开式水、闭式水系统课件.pptx VIP
- (二诊)成都市2022级2025届高中毕业班第二次诊断性检测英语试卷(含标准答案).docx
- 中国历史文选 中国历史文选复习.docx VIP
- 医院检验科实验室生物安全管理手册.docx
原创力文档

文档评论(0)