- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
从业人员收入模型
建模研究小组
一、 建立模型条件
已经掌握一定数量的有效数据,这些数据应该充分反映我们所要分析的某类人群一般收入规律。数据本身需要具备有效性、真实性和代表性。
二、建立模型构想
虽然不同类型单位或不同所属行业的从业人员,每月收入水平都不一样,但是同一行业的从业人员,每月收入之间都有着一定的特殊关系。我们通过对该类人群的相关数据分析,分析出不同月份该类申请人群收入之间的内在联系,从而研究得出该类人群的收入模型。
四、模型建立
研究相关关系即研究如何从一个变量取得的值去估计另一变量所取值的研究。
设随机变量 Y(因变量)与普通变量 X(自变量)之间存在着相关关系,由于Y 是随机变量,对于X 的各个确定值。作为一种近似,我们转而去考虑 Y 的数学期望,若 Y 的数学期望 E(Y) 存在,则其值随X 的取值而定,它是X 的函数。将这一函数记为μ(X),称为 Y 关于 X 的回归函数。这样,我们就将 Y 与 X 的相关关系的问题转换为 E(Y)=μ(X)的函数关系了。
若η是一个随机变量,则 E[(η-c)2]作为 c 的函数,在c=E(η)时 E[(η-c)2]达到最小。这表明在一切X 的函数中以回归函数μ(X)作为Y 的近似,其均方误差E[(Y-μ(X))2]为最小。因此,作为一种近似,为了研究 Y 与 X 的关系转而去研究μ(X) 与 X 的关系是合适的 。
在现实问题中,回归函数μ(X)一般是未知的,回归分析的任务是在于根据试验数据去估计回归函数,讨论有关的点估计, 区间估计,假设检验等问题。特别重要的是对随即变量 Y 的观察值作出点预测和区间预测。
我们对于 X 取定一组不完全相同的值 X1 ,X2 ,……,Xn , 设 Y1,Y2,……,Yn 分别是 x1,x2,……,xn 出对 Y 的独立观察结果,称(x1 , Y1),(x2 ,Y2),……,(xn ,Yn)是一个样本,对应的
样本值记为(x1 , y1),(x2 , y2),……,(xn ,yn) 。
我们的问题是如何利用样本来估计 Y 关于 X 的回归函数μ
。
设 Y 关于 X 的回归函数为μ(X)。通过我们将每对观察值(xi,yi) 在直角坐标系中所反应出相对应点的情况,得出μ(X)=a+bX,此时就是一个线性函数。
我们假设对于X(在某个区间内)的每一个值有Y∽N( a+bX, σ2),其中 a,b 及σ2 都是不依赖于 X 的未知参数。
Y = a+bx+ε, ε∽N(0,σ2)
其中位置参数 a,b 及σ2 都不依赖于 X,称之为一元线性回归模型,其中b 称为回归系数。因变量Y 由两部分组成,一部分是X 的线性函数 a+bx,另一部分ε∽N(0,σ2)是随机误差,是人们不
可控制的。即
申请人本月收入==关于上月收入的函数+随机误差
其中因变量 Y 为申请人本月收入,自变量 X 为申请人上月申报收入,参数 a 为估计得到的常数,参数 b 为估计得出的回归系数。
五、 模型参数的确定
取x 的 n 个不全相同的值 x1,x2,……,xn 作独立试验,得到样本(x1 , Y1),(x2 ,Y2),……(xn ,Yn)。Yi=a+bxi+ εi , εi
∽ N(0, σ 2), 各 ε i 相 互 独 立 。 于 是 Yi ∽ N(a+bxi, σ 2),i=1,2, … … ,n 。 由 Y1,Y2, … … ,Yn 的 独 立 性 , 知Y1,Y2,……,Yn 的联合密度为
?n 1
?
?2
?
2 ?
? ? 1 ? y
a ? bx
?2 ?
i ? 1
?? 2 ? 2 i
i ??
接下来用最大似然估计法来估计未知参数 a,b。对于任意一组观察值 y1,y2,……,yn 上面的 L 就是样本的似然函数。显然,要L 取最大值,上式右端方括号中的平方和部分为最小。
即只需函数
Q ? a , b ? ? ?n ( y
i
i ? 1
a ? bx ) 2
i
取最小值。
取 Q 分别关于 a,b 的偏导数,并令它们等于零:
?? ? Q ? ? 2 ?n
?
? ? a
( y ? a ? bx
i
) ? 0
i
? i ? 1
? ? Q ? ? 2 ?n ( y
a ? bx ) x ? 0
?? ? b
i i i
i ? 1
由于 xi 不全相同,正规方程组的系数行列式不等于零,所以有
唯一的一组解。
解的 a,b 的最大似然估计值为
?? a ?
?
?
1 ?n
n
y ? b ?n
?i n
?
x ? y ? b x
i
? ?n x ? x ??
y
y
y ?
i ? 1 i ? 1
?
? ??
? ?
b ? i ? 1
? n
??
x ?
1其中 n
1
原创力文档


文档评论(0)