- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
定性数据数量化
定性数据的数量化;数学建模会遇到各种各样的实际问题,在许多问题中经常会遇到分类变量.像前两年全国的竞赛题,公务员招聘问题中专家对应聘者的考评,出版社资源分配问题中读者对出版物评价,部门或图书的分类等等,都是一些定性数据.
如何处理这些分类变量的定性数据?
一种办法是直接按定性数据建模.如统计数据处理中的对数线性模型, Logit模型等等.
有很多情况需要将定性数据数量化,再按数量数据用于建立数学模型.这就要求定性数据数量化一定要合理,否则即使模型是合理的、可行的,但分析结果会脱离实际,没有意义.;如何合理地将定性数据数量化?
定性数据有两大类:一类数据是有顺序的,也就是有大小、优劣等顺序,如专家对应聘者的考评、读者对出版物评价等等.另一类数据则是无顺序,仅有名义,如部门或图书的分类等等.
对有顺序的定性数据往往可直接数量化,但直接将几个等级数量化成1、2、3、4是不可取的.如出版社资源分配问题中读者对出版物评价有{不好,勉强可以,一般, 较好,非常好}五个等级,但现实中人们对这些等级有确定的认知,不能认为这些等级是等距的,通常人们对不满意程度的敏感远远大于对满意程度的敏感.对这些等级量值的认定是一个与心理学有关的问题.;;
式中 为待定参数,c为等级中基本可接受的等级值,比如在上述分级中{一般}是可接受的等级,则c=4.然后,最低的定为接近0,即f(1)=0.01,最高的定为1,f(7)=1,再认定f(c)=f(4)=0.7,这就可确定出参数
最后定出各等级的量化值
; ;(I)有数量外基准值Y场合的量化
这时样本数据形式为;Y在第j个项目有cjk类的反应,则在相应位置记1,对一个项目只能有一种类反应,且必有一种类反应.我们可以定义
显然有
这样,当我们给cjk赋予数量值xjk时,考虑简单的线性关系的话,第i个体由分类项目1---R确定的值为;以Y作为基准,当然要求α与Y “相近”或相关程度高,依最小二乘的准则,用
度量“相近”,因此我们要选择xjk使Q达到最小,这与经典线性回归分析中求解回归方程参数的要求是一样的.可以用微分求极值的方法,建立正规方程
从中解出xjk .;用矩阵形式比较简洁.给以矩阵记号
由于各项目对每一个i全体类的 之和均为1,为使A满秩,从2---R各项目删除一列,相应的xr1取值0,r= 2---R.
按矩阵记号;正规方程为
解出
实际上,可以用现成的回归分析软件求出x,只要输入向量Y和矩阵A,即可.
在数量化的基础上可以做一些相应的数值分析,如由x预y,分析1---R这些分类变量间的关系等等;(II)有分类外基准场合的量化
外基准是样本个体的分类,而不是数值变量.此时数据形式为;样本总量n=n1+n2+---+nT,我们仍然给予cjk量值xjk,R个项目间考虑为加性,仍然记
则有;可以求得α的方差和组间方差
显然应该要求
经计算,可得;代入前面的式子,得下列方程组
用矩阵记号,记 H=[h(uv,jk)] F=[f(uv,jk)],则方程组为
Hx=η2Fx , x’=(x11,--,x1k1,---,xR1,--,xRkR)
即 [ F-1H-η2I]x=0;方程组 [ F-1H-η2I]x=0 要x有非零解,则η2应是 F-1H 的特征根,x是相应的特征向量.
若有s个非零特征根
η12 η22 ---ηs2
则可求得x的s组解,可从大到小取定需要的组数,每一个解确定一个一维的分类判定准则,几个准则一起可确定多维分类判定准则.
这种情形的数量化实际上与多元Fisher判别类似,可以用其相应的软件进行计算.;(III)无外基准场合的量化
样本数据直接记成下列形???,
出现相同特征的个体应该相近,反之在相同个体中出现的特征应该相近.为了衡量个体与特征间的亲近关系,若个体有值yi,i=1—Q,特征Lj有值xj,j=1---R,可以定义两者间相关系数.;上面的数据表与二变量二维列联表很相似,
二维列联表
对二维变量(Y,X)由列联表可计算出;对数据表作类似的计算,定义;依列联表的计算则易得
这样要使ρ达最大,解正规方程;帘这授鳃拷满蔡睹件席犯盎副胆槽还篱怀沉神扇落袭瓢掣祝谆急掇孟掠予定性数据的数量化定性数据的数量化;
为了有非零解,ρ2应为矩阵F-1A的特征根,解x为相应的特征向量.y易由x导出.;参考文献:
林知已夫著,
数量化の方法, 东洋经济新报社.
林知已夫、村山孝喜著,
市场调查の计画と实际,日刊工业新闻社
文档评论(0)