- 6
- 0
- 约3.54千字
- 约 7页
- 2024-04-02 发布于北京
- 举报
数理统计前沿问题研究期末考试试卷
一、名词解析(10×4=40分)
1.大数据分析。
答:大数据分析是指对规模巨大的数据进行分析。大数据可以概括为5个V,数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)、真实性(Veracity)。大数据作为时下最火热的IT行业的词汇,随之而来的数据仓库、数据安全、数据分析、数据挖掘等等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。随着大数据时代的来临,大数据分析也应运而生。
充分降维方法。
答:充分降维方法是“恢复”中心降维子空间的一种方法,通常分为如下几个步骤
(1)“识别”中心降维子空间:基于总体形式(XT,Y),寻找一个矩阵A,使得span(A)SY|X,这样的矩阵A被称为核矩阵;
(2)“估计”中心降维子空间的基方向:基于样本{(xT,y)i=1,…,n}来估计核矩阵An,对于核矩阵的估计An进行谱分解,得到特征值和特征向量,非零特征根所对应的特征向量可以作为中心降维子空间的基方向;
(3)“估计”中心降维子空间的维数:如果结构维数已知,则上述两步就足够了;否则,需要进一步估计中心降维子空间的结构维数K=dim(Sy|x)
3.变系数部分线性模型
答:变系数部分线性模型:设Y是响应变量,(U,X,Z)是联合协变量,那么变系数部分线性模型具有如下形式:
Y=aT(U)X
原创力文档

文档评论(0)