数据分析处理技术..docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据分析处理技术.

数据分析处理技术 主讲教师简介:郑军,女,辽宁税专第一教学部教师,副教授。 导 论 什么是统计学 1、统计是处理数据的一门科学。 2、统计学是关于数据的科学,它所提供的是一套有关数据收集、处理、分析、解释并从数据中得出结论的方法。 3、数据分析所用的方法可分为描述统计方法和推断统计方法。 二、理解统计对每个人都是必要的。 第一部分 数据的整理与图示 一、数据的类型 按照采用的计量尺度不同,可以将数据分为分类数据、顺序数据和数值型数据。 1、分类数据:是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述。如:企业按行业分类等。为便于统计处理,对于分类数据可以用数字代码表示各类别,如用1表示制造业,2表示建筑业等。 2、顺序数据:是只能归于某一有序类别的非数字型数据。顺序数据虽然也有类别,但这些类别是有序的。如将产品分为一等品、二等品、三等品、次品等。同样,对顺序数据也可以用数字代码来表示。 3、数值型数据:是按照数字尺度测量的观测值,其结果表现为具体的数值。现实中所处理的大多数都是数值型数据。 品质数据(分类数据和顺序数据、定性数据) 数量数据(数值型数据、定量数据) 4、区分数据的类型十分重要。因为对不同类型的数据,需要采用不同的方法来处理和分析。 二、数据的搜集 1、数据的来源(数据的间接来源、直接来源)。 2、调查数据(概率抽样、非概率抽样)。 概率抽样(即随机抽样):常用的方式有简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样。 非概率抽样:常用的方式有方便抽样、判断抽样(重点抽样、典型抽样)、自愿样本、滚雪球抽样 3、搜集数据的基本方法(自填式、面访式、电话式、)。 4、数据的误差(抽样误差、非抽样误差)。 抽样误差(由于抽样的随机性引起的样本结果与总体真值间的误差) 非抽样误差(回答误差、调查员误差等) ★ 三、数据的图表展示 (一)、数据的预处理(审核、筛选、排序等)。 (二)、分类汇总与数据透视表(数据的全新整理分析方法) (三)、品质数据的整理与展示。 1、分类数据的整理与图示(频数与频数分布) 2、顺序数据的整理与图示(累计频数和累计频率、环形图) (四)、数值型数据的整理与图示(数据分组、直方图)。 (五)合理使用图表 (一)、数据的预处理:是在对数据分类或分组前所做的必要 处理。内容包括数据的审核、筛选、排序等。 1、数据审核:对原始数据审核其完整性和准确性; 对二手数据审核其适用性和时效性。 2、数据筛选:根据需要找出符合特定条件的某类数据。 3、数据排序:按一定顺序将数据排列,以便通过浏览数据发现明显的特征或趋势等。 (二)、数据透视表(数据的全新整理分析方法) 为了从复杂的数据中提取有用的信息,可以利用Excel提供的【数据透视表】工具。利用数据透视表,可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图,形成一个符合要求的交叉表(列联表)。在利用数据透视表时,数据源表中的首行必须有列标题。 (三)、品质数据的整理与展示 数据经过预处理后,可根据需要进一步做分类或分组。对品质数据主要做分类整理,对数值型数据主要是做分组整理。 1、分类数据的整理与图示(频数与频数分布) 分类数据本身即是对事物的一种分类。在整理时首先列出所分的类别,然后计算出每一类别的频数、比例等,即可形成一张频数分布表,最后根据需要选择适当图形进行展示,以便对数据及其特征有一个初步了解。 分类数据的图示(条形图、帕累托图、饼图等) 2、顺序数据的整理与图示(累计频数和累计频率、环形图) (四)、数值型数据的整理与图示(数据分组、直方图) 第二部分 数据的概括性度量 (集中趋势、离散程度、偏态与峰态的度量) 一、总量指标分析 二、相对指标分析 ★三、集中趋势度量 ★四、离散程度度量 ★五、偏态与峰态度量 一、税收总量指标分析 (一)、税收总量指标的分析要求 对总量指标的分析和描述应简洁、明了、突出其主要数量特征,给人以深刻印象。 例:“十五”期间,我市税收从2000年的561,484万元增加到2005年的1,203,402万元,年均增长16.47%,为我市经济和社会的发展提供了有力的财力保障。 (二)、税收总量指标的图表描述 总量指标在Excel 中的图表具体可描述为折线图、条形图(横 置或纵置)等。(条形图纵置时也称为柱形图) 二、税收相对指标分析 在税收数据分析中,方法最简便、应用最广泛的就是相对指标的计算与分析,因其概念比较清晰,这里只对其计算方法作一介绍。 相对指标是两个有联系的指标对比的比值,反映事物的数量特征和数量关系。

文档评论(0)

stzs + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档