数据采集、清洗与标注 第4章课后习题参考答案.docx

数据采集、清洗与标注 第4章课后习题参考答案.docx

第4章课后习题参考答案

1.互联网数据组织形式(第4章4.1.1节)

??三大核心类型??:

??结构化数据??

特征:固定模式存储

示例:MySQL关系表(教材表4-1)

典型应用:电商产品目录

??半结构化数据??

特征:自描述性标记

案例:JSON格式的API响应(实例4-8)

{

product:手机,

price:3999,

in_stock:true

}

??非结构化数据??

特征:无预定义模型

典型数据:社交媒体图片/视频

处理挑战:需要CV/NLP技术解析

??特殊类型??:

流式数据(实时日志)

图数据(社交网络关系)

2.网络爬虫工作流程(第4章4.1

文档评论(0)

1亿VIP精品文档

相关文档