- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
我学数学的一点体会
决策树是类似如下的一棵树 Outlook sunny rain overcast Play=no Play=yes windy false Play=yes True Play=no 给定一个新的天气象:“rain,hot,high,true”,则判别其类别 则年级属性的众数为“一年级”。 对于连续属性,按照目前的定义,众数通常没有用(为什么?),但在某些情况下,众数可能提供关于值的性质或关于出现遗漏值的重要信息。 年级 人数 频率 一年级 200 0.33 二年级 160 0.27 三年级 130 0.22 四年级 110 0.18 例如,以毫米为单位,20个人的身高通常不会重复,但如果以分米为单位,则某些人很可能具有相同的身高。此外,如果使用一个唯一的值表示遗漏值,该值通常用众数。 1.1.2 百分位数 百分位数的定义:设有容量为n的样本观察值想x1,x2,x3,...,xn,样本的p分位数(0p1)是指满足如下性质的xp : A:至少有np个观察值小于或等于xp。 B:至多有n(1-p)个观察值大于或等于xp。 样本的p分位数xp 可以按如下方法求得: 将观察值按自小到大的顺序排列成:x(1)≤ x(2) ≤... ≤ x(n); 即:xp= 1。:若np不是整数,则只有一个数据满足定义的两点要求,这一数据位于大于np的最小整数处,即[np]+1处; 2。:若np是整数,则位于np和np+1位置的数据均符合要求,此时取这两个数的平均值作为xp; x([np]+1) 当np不是整数 (x(np)+x(np+1))/2 当np是整数 与分位数有关常用术语 一、极差:x(n)- x(1); median(x)= 二、中位数:p=0.5,此时xp称为中位数,记为median(x)其计算如下: x([n /2]+1) 当n为奇数 (x(n/2)+x(n/2+1))/2 当n整为偶数 三、第一四分位数Q1:p=0.25;第三四分位数Q3:p=0.75;四分位数极差IQR=Q3-Q1; 例1.下表是中国各省(市)国有单位的人均报酬,单位:元/年。分别计算p=0.25,0.5,0.75时的分位数及样本均值。 地 区 上海 浙 江 浙江 北京 西 藏 人均年收入 50311 47587 47587 45823 44813 地 区 广东 天津 江苏 青海 福建 人均年收入 36053 34509 32738 28681 27423 地 区 山 东 山东 宁夏 重庆 辽宁 人均年收入 26986 26986 26157 25060 24281 地 区 四川 湖南 湖 南 内蒙古 广西 人均年收入 24045 22956 22956 22711 22614 地 区 云南 山西 河南 甘肃 安徽 人均年收入 22275 22107 22044 21968 21960 地 区 贵州 湖北 吉林 陕西 新疆 人均年收入 21608 21591 21502 21345 21213 地 区 河北 江西 海南 黑龙江 人均年收入 20754 19298 18720 18392 解:n=34,n*0.75=8.5,Q3= 32738(江苏),同理,median=22956(湖北或湖南),Q1=21608(贵州),Q3-Q1=11130,样本均值为27501.59 箱线图如下: Q3 18392 黑龙江 Q1 Min Max 21608 贵州 32738 江苏 50311 上海 M 箱线图的说明:若中位数位于箱子中间,则数据分布较为对称;若Min离M的距离较Max离M的距离大,在表示数据分布向左倾斜;反之向右。 二、估计 2.1 点估计 2.1.1 矩估计与极大似然估计 另外一种常用的估计方法为折叠刀估计,它通过从一组观测值中忽略一个值来实现对参数的估计。 假设一个具有n个值的集合x={x1,x2,...,xn},对均值的单次估计为: 2.1.2 折叠刀估计 θ(i)=(x1+...+xi-1+xi+1+...xn)/(n-1) 对这些单次估计求平均值θ= (θ(1)+... θ(n))/n作为总统的均值估计。 例:设总体的分布率如下: 现有样本的10个观察值:3,3,2,2,1,2,1,2,3,3,分别用矩估计发、极大似然估计法和折叠刀估计法估计θ。 解:矩估计法 X 1 2 3 Pk θ2 2θ(1- θ) (1- θ)2 E(X)=3-2θ, 又样本均值为2.2, 因此θ得矩估计值为0.4 极大似然估计:L( θ)=。。。。, θ的极大似然估计
您可能关注的文档
- 文献检索 - 图书馆.ppt
- 纹理分析法识别静止卫星红外云图和监测汛期强对流天气系统.pdf
- 纹理分析法识别静止卫星红外云图和监测汛期强对流 - 中国干旱气象网.pdf
- 文献计量学理论与应用 - 北京大学医学图书馆.pdf
- 稳定性水泥浆体在岩体裂隙中的流动性能及其灌浆技术.pdf
- 稳健贝叶斯方法在指数保费原理下的应用①.pdf
- 问题栏 - 黑龙江律师协会.doc
- 稳健统计用于扩频激电数据预处理与脉冲噪声压制 - researchgate.pdf
- 问题三操作详解183 实例的spss输出结果详解问题一输出结果详解.ppt
- 汶川地震断层带结构及渗透率 - 中国地震信息网.pdf
- 乌鲁木齐25米射电望远镜6cm接收机 成功进行国内首次偏振试观测 8 .doc
- 乌东德水电站右岸地下厂房随机块体特征研究 - 现代地质.pdf
- 乌司他丁应用概况的可视化研究 - 中国中西医结合急救杂志.pdf
- 乌山头厂竹仔坑抽水站抽水机效率最佳化节能操 - 台湾自来水公司【第 .pdf
- 污染底质修复目椽的制定方法.pdf
- 污染场地渗透系数非均质性表征研究 - 水资源与水工程学报.pdf
- 无母数统计学第四章两组有关样本的推论方法.pdf
- 无农药污染水稻病虫综合防治 - 系统发生错误.doc
- 无缆存储式地震检波器性能指标与地球物理效果分析 - 合肥国为电子 .doc
- 无漂移有源低通滤波器的统计灵敏度优化 - 山东大学学报(工学版).pdf
最近下载
- 《道路运输管理实务》课件——第五章 特种货物运输业务组织.pptx VIP
- A公司个人所得税纳税筹划案例分析.docx VIP
- 高压供电系统的设计.pdf VIP
- PLC应用技术(西门子S7-1200)全套教学课件.pptx VIP
- 新教材人教版二年级数学上册 第1 单元 分类与整理 第4课时 练一练.pptx VIP
- 装修合同协议书工装.doc VIP
- 人教PEP版五年级上册英语全册教案(6个大单元整体教学设计).pdf VIP
- 一种电子烟挥发性气体检测报警装置.pdf VIP
- 《道路运输管理实务》课件——第四章 零担货物运输业务组织.pptx VIP
- 中职《中华优秀传统文化选讲》 第二讲 璀璨华章——文学经典.pptx VIP
文档评论(0)