ROC分析方法概要.docxVIP

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第二章ROC曲线(qūxin)分析概要

本文(bǎnwn)先介绍了ROC理论的一些(yxi基础知识如特异度和灵敏度等,然后简要介绍(jièsha)了非参数ROC分析方法,并建立(jiànl)了ROC模

型。最后介绍了ROC曲线及在R软件中的绘制。

2.1ROC分析的基本要素

ROC分析的基本要素包括真阳性和假阳性也称灵敏度和特异度,以及“金标

准”

“金标准”划分被测试者的真实状态为对照组和病例组两类。常见的金标准有跟踪随访、活组织检查、尸体解剖、手术探查等。虽然“金标准”没有必要是十全十美的,但“金标准”应与评价的诊断系统无关,而且比要评价的诊断系统

更可靠。“金标准不够完美时,可用采用Bayesian、含糊金标准、EM估计等

方法解决。

对按照“金标准”确定的二分类总体,对照组和病例组分别用阴性和阳性表

示诊断试验结果。假定总体样本量是N,诊断试验的可能结果总共有四种:被

测试者患病且被正确诊断为患病者,被测试者无病且被错误诊断为患病者,被测试者无病且被正确诊断为无病者,被测试者无病且被错误诊断为患病者。我

们可以用一个2×2的列联表来表示它们之间的关系。

诊断结果

“金标准”

合计

患病者

健康者

阳性

a(真阳性)

b(假阳性)

a+b

阴性

c(假阴性)

d(真阴性)

c+d

合计

a+c

b+d

a+b+c+d=N

在医学研究(yajiu中,诊断试验准确度指标最常用的是灵敏度与特异

度。

灵敏度(sensitivity),也叫真阳率(truepositiverate,即TPR)是

被测试者患病且被正确诊断为患病者的样本量在阳性总体(zǎngt)中占的比

例。灵敏度值越大,假阴率越小。据表2-1其计算公式是:灵敏度

(sensitivity)=真阳率(TPR)=1假阴率

标准(biāzhn)误为:SErpR=√ac/(a+c)3

特异(tà)度(specificity),也叫真阴率(truenon-positive

rate,即TNPR),是受试者无病且被正确诊断为无病者的样本量占阴性总体的

比例。

假阳率(falsepositiverate,即FPR)=1特异(tày)度

特异度值越大,假阳率越小。据表2-1其计算公式是:

d

b+d特异度(specificity)=真阴率(TNPR)=1假阳率(FPR)=

b+d

标准误为:SEppR=√bd/(b+d)3

假设二分类总体均服从正态分布,TPR、FPR、TNPR和FNPR之间的关系可以用图2-1来描述。图中x=c为截断点(诊断阈值),α为假阳率(FPR),

β为假阴率(FNPR)。

2.2ROC准确性评价(pngjia)指标的优越性

诊断试验的准确性评价指标(zhbia)有正确率、灵敏度和特异度等。它们虽

然都可以

反映诊断的准确性,但评价的效果(xiàguǒ不是很理想。

正确(zhàngquθ率是被测试者被正确诊断的例数和所占总体的百分数。其

计算公式是:

标准(biāzhǔ)误是:SE正确百分率=√(a+d)(b+c)/N3

正确百分率的不足之处:

1.很大程度上依赖患病率。例如,虽然患病率是5%,如果判定所有样本

为健康者,也有可能有95%的正确百分率;

2.受诊断阈值的限制;

3.没有表示出假阳性和假阴性错误诊断所占的比例,没有惟一性表示,

即使有相同的正确百分率的两个总体,也可能有十分不同的假阳性和假阴性。

基于此,单独计算灵敏度和特异度,以弥补正确率的不足,如果两个指标的值越高,诊断评价效果也就越好,其实不然。在对诊断系统做出比较时,如果单独使用灵敏度与特异度,就会存在很大的不足:这两个指标依赖于诊断阈值(或者截断(jěduàn)点),改变诊断阈值可以增加诊断的灵敏度,但同时也减

少了特异度;反之,如果增加诊断的特异度,则需要以减少灵敏度为代价。

此外,有人(yǎurú)提出的Youden指数(zhshù、阳性似然比、:真阳率

与假阳率之比)和阴性(yīxìg)似然比等等。

Youden指数(zhshù)是指真阳性率与假阳性率之差,计算公式为:

Youden指数=灵敏度+特异度-1=真阳性率-假阳性率

其标准误为:

(positivelikelihood简写i为:LR+)

(positive

likelihood

简写i为:

LR+)

是真阳性率与假阳性

曲线某工作点对应的斜率之比,即灵敏度与(1-特异度)的比值,它是R

文档评论(0)

xiaoqiong1111 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档