ch2 描述性统计2016PPT.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ch2 描述性统计2016PPT

第二章 描述性统计;2.2 数据的种类;;不同数据类型的运算等级 ;不同类型的数据在计算时的性质不一样;文本数据;中国;八系Mentor活动总结的词云图——温暖、正能量;总理报告主题词: 经济、发展、改革;数据(data):在拉丁文里是“已知”的意思,或“事实” 数据收集:历史记录、传感器、手机导航、网站点击、微博 数据化——把现象转变成可以制表分析的量化形式过程。 ;当沟通变成数据: 关系、经历、情感 社交网络不但提供了寻找和维持朋友关系的场所,也将我们日常生活的无形元素提取出来,转化成可做新用途的数据。例如Twitter让人们轻易记录和分享他们零碎的想法(这些在以前,都会成为遗忘在时光中的碎片),从而实现了人们的想法、情绪和沟通的数据化。 Facebook社交图谱,将社交关系数据化;一些信贷领域的公司正考虑开发以Facebook 社交图谱为依据的信用评分,因为有研究表明:个人会偿还债务的可能性与朋友会偿还债务的可能性是正相关的,即“人与类聚,物以群分”。 许多公司对微博做了句法分析,使用情感分析技术,以获得顾客反馈意见的汇总或对营销活动效果进行判断; 对冲基金公司开始分析微博文本数据,以作为股市投资的信号;;案例:当人坐着的时候,人的身形、姿势和重量分布都可以量化和数据化。日本科学家越水重臣通过在汽车座椅下安装360个压力传感器以测量人对椅子施加压力的方式,可以根据人体对座位的压力差异识别出乘坐者的身份,准确率高达98%。汽车可以识别乘坐者是否是车主,不是的话,系统就会要求司机输入密码。这个系统还可以根据坐姿,在司机疲劳驾驶时发出警示或者自动刹车。;PRADA服装下架策略; 中国人保: 车联网——交通车险理赔 通过交通探头视频数据联网,图像比对,智能分析, 核定车险理赔数额,推荐维修厂点 ;;问题2. 怎么能大致了解加工数量的分布情况? Max = 128 (件); Min = 84 (件) R=Max{xi}-Min{xi} = 128 - 84 = 44 采用组距 h= 10,可以分为5组。 (1)多数工人的日加工量集中在100~110之间; (2)两头小、中间大,不很对称。;;; 最高学历 频数 初中 15 高中 200 ??科 185 硕士 55 博士 70 其他 25 合计 550 ;天猫店铺动态评分;增长与结构: 基金项目申请结构动态变化 ——各个学部申请量变化;巧绘条形图: 金字塔图 2010年北京市的肿瘤发病率、死亡率;人人网用户的网购调查;坐标值应该有逻辑;谨慎使用像形的柱状图; 2000年城八区的经济发展与生活水平 ;发电量与工业增加值 (1995~2007);互联网企业用户资产与财务资产的关系;四. 饼图( Pie Chart );北京晚报 2013年3月6日;奥巴马各项政策的支持率;;社交网络、搜索门户、电子商务 Top4企业的用户资产市场份额; 当展示使用不同类型的手机和平板用户占比时,直接用总的苹果图形为背景来划分用户比例,让用户第一眼就可以直观看到这些图是在描述苹果设备的,直观而清晰。;面积图:动态比率结构;五. 线图 ( Line Chart);2000年南、北城的经济发展轨迹 ;城八区人均GDP最高与最低之差值;英国理财服务公司ThinkMoney在2013年情人节前对当地男女择偶标准的调查 不少男性(27%)还认为体面的工作也是女性眼中重要的择偶标准线。但是英国女性自己的想法却截然不同:仅仅有6%的女性表示会将对方收入当成重要的考量因素。 ;;六. 雷达图 (Radar chart)、星图(Star Chart) 1997 年城乡居民家庭平均每人生活消费支出;公司黄页: 公司综合实力与同行平均水平的对比便一目了然。 该公司的货品质量高于行业平均水平。但是“信用状态”的水平急需提高!;美国的犯罪率 (雷达图);美国的犯罪率 南丁格尔图 极坐标区图 (polar area diagram) ;2008年赛季NBA场均表现数据: ——如何在满足多种标准的集合中,发现特异值;美国犯罪率气泡图;中国互联网行业的市场环境问题 ;2048年7月27日中国和印度的人均收入 会赶上美国和英国;九、切尔诺夫脸谱图 (Chernoff Faces);NBA场均表现数据(08-09赛季部分球员得分) ;十、有关空间关系的可视化——着色地图; 着色地图:2010年北京市各区县肺癌发病率分布图;小结:描述性统计的基本原则;描述性

文档评论(0)

erfg4eg + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档