- 1
- 0
- 约2.83万字
- 约 41页
- 2026-06-10 发布于江西
- 举报
数据分析与报告撰写手册
第1章数据基础与工具
1.1数据分析核心概念与术语
数据(Data)是指经过采集、记录或处理的信息集合,它是所有数据分析活动的基石;在商业场景中,数据通常分为结构化数据(如数据库中的表格)和非结构化数据(如文本、图像、视频),前者适合进行精确的统计分析,后者则需要结合自然语言处理技术。变量(Variable)是数据的基本单元,它代表一个可以测量的属性;例如,在销售数据中,“销售额”是一个数值型变量,而“客户姓名”是字符型变量,不同的变量类型决定了后续分析的方法截然不同。
数据集(Dataset)是由多个记录(Record)和多个变量(Variable)组成的集合,每一个记录代表一个观测对象(如一个客户或一条交易记录),数据集是进行建模和测试的最小单位。特征(Feature)是数据集中用于预测或分类的特定属性,它是机器学习算法直接作用的输入;例如,在房价预测模型中,“房屋面积”和“房屋位置”是两个关键的数值型特征,而“房屋装修”可能是一个分类特征。指标(Metric)是对数据集中特定属性的量化度量,用于评估数据质量或业务表现;例如,“库存周转率”是一个综合指标,它通过计算“库存天数”来反映产品卖出的速度。
假设(Hypothesis)是分析师对数据特征或模型性能提出的可验证的预测,例如“如果增加广告预算,率将显著上升”,假设是分析工作的起点
您可能关注的文档
最近下载
- 城市园林绿化养护 投标方案(技术方案).docx
- 如何找回误删微信好友,微信好友一键恢复.doc VIP
- 2024中国工商银行广西分行星令营暑期实习笔试历年典型考题及考点剖析附带答案详解.docx VIP
- 3.5《发光发热的太阳》教学设计 2026科学教科版三年级下册.docx VIP
- (建筑给排水工程)BOP原水预处理系统及锅炉补给水处理系统分部试转.doc VIP
- 北京市2023-2024学年八年级下学期数学期末汇编:几何综合压轴题.docx VIP
- 山东奔虎气体报警器说明书_104258.pdf
- 湖南省湘潭市第一中学2024-2025学年八年级下学期期末考试数学试卷(含详解).pdf VIP
- 学堂在线医学专业英语中南大学课后题答案.docx VIP
- Unit+2+Success+Topic+Talk高中英语北师大版(2019)选择性必修第一册.pptx VIP
原创力文档

文档评论(0)