抽样的分类、概率抽样方法及注意事项_新能源检测技术材料化学元器件汽车电子热分析实验室仪器温度研发工程师试验硬件质量检测.docVIP

抽样的分类、概率抽样方法及注意事项_新能源检测技术材料化学元器件汽车电子热分析实验室仪器温度研发工程师试验硬件质量检测.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抽样的分类、概率抽样方法及注意事项 如何进行抽样 1 抽样分类 ? 1)概率抽样:以数据概率论为基础,按照随机的原则进行抽样; 2)非概率抽样:根据人类的主观经验和状态进行判断; ? 2 概率抽样方法 1)简单随机抽样:按等概率原则直接从总中抽取N个样本 优点:易于操作; 缺点:不能保证样本能完美代表总体; 适用:个体分布均匀的场景 ? 2)等距抽样:先将总体中的每个个体按顺序编号,然后计算出抽样间隔,再按固定抽取个体 优点:易于操作; 缺点:再明显的分布规律时容易产生偏差; 适用:个体分布均匀的场景,呈现明显的均匀分布规律 ? 3)分层抽样:先将所有个体样本按照某种特征划分为几个类别,然后从每个类别中使用随机抽样或等距抽样的方法选择个体组成样本 优点:降低抽样误差,针对不同类别的数据样本进行单独研究; 缺点:无缺点; 适用:带有分类逻辑的属性,标签等特征的数据 ? 4)整群抽样:先将所有样本分为几个小群体集,然后随机抽样几个小群体集代表总体。 优点:易于操作; 缺点:分布受限于小群体集的划分,抽样误差较大; 适用:小群体集的特征差异比较小,并且对划分小群体集有更高的要求 ? 3 抽样需要注意问题 1)反应抽样背景 a.数据时效性; b.业务增长性; c.数据来源多样性; d.业务数据可行性 2)满足数据分析和建模需求 a.抽样样本量; A.以时间为维度分布,至少包含一个能满足预测的完整业务周期; B.做预测(包含分类和回归)分析建模的,需要考虑特征数量和特征值域(非数值)的分布,通常数据记录数同时是特征数量和 特征值域的100倍以上; C.做关联规则分析模型,根据关联前后项的数量,每个主体需要至少1000条数据。 D.异常检测类分析建模,无论是监督还是非监督建模,数据记录越多越好 ? b.抽样样本在不同类别中的分布问题

您可能关注的文档

文档评论(0)

纸质内容 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档