大数据的惩罚整分合析方法.docxVIP

  • 20
  • 0
  • 约1.39万字
  • 约 12页
  • 2017-03-04 发布于四川
  • 举报
大数据的惩罚整分合析方法

大数据的惩罚整合分析方法【摘要】:大数据具有数据来源差异性、高维性及稀疏性等特点,如何挖掘数据集间的异质性和共同性并降维去噪是大数据分析的目标与挑战之一。惩罚整合分析(Penalized Integrative Analysis)同时分析多个独立数据集,避免因地域、时间等因素造成的样本差异而引起模型不稳定,是研究大数据差异性的有效方法。它的特点是将每个解释变量在所有数据集中的系数视为一组,通过惩罚函数对系数组进行压缩,研究变量间的关联性并实现降维。本文从同构数据整合分析、异构数据整合分析以及考虑网络结构的整合分析三方面梳理了惩罚整合分析方法的原理、算法和研究现状。统计模拟发现,在弱相关、一般相关和强相关三种情形下,Group Bridge、Group MCP、Composite MCP都表现良好,其中Group Bridge的假阳数最低且最稳定。最后,将Group Bridge整合分析用于农村新农合的家庭医疗支出分析,发现不管在总体还是各个地区,它都比单数据集分析的预测效果更好。关键词:大数据;惩罚整合分析;变量选择;医疗支出中图分类号:F222.3文献标识码:APenalized Integrative Analysis Approaches for Big DataAbstract:?The difference of data source, high dimensional

文档评论(0)

1亿VIP精品文档

相关文档