Cost-Sensitive学习的一个新课题.pdfVIP

下载本文档

31
0
约8.35千字
约 5页
2015-09-07 发布于湖北
举报

Cost-Sensitive学习的一个新课题.pdf

第25卷第4期广西师范大学学报：自然科学版 V01．25No．4 of Normal ScienceEdition Dee．2007 2007年12月 JournalGuangxi University；Natural Cost—Sensitive学习的一个新课题周生明，廖元秀 (广西师范大学计算机科学与信息工程学院，广西桂林541004) 习中还有一种代价对分类的总代价有较大影响．这种代价可称为分类延时代价，即延谩分类而造成的代价．类过程中的误分类代价、检查代价及分类延时代价之和达到最小。给出包含一种简单的分类延时代价的 Cost—Sensitive学习，提出一个既“摊薄”延时代价又减步浪费检查代价的检查策略．关键词：Cost—Sensitive学习}分类延时代价}序列检查策略I批检查策略中圈分类号：TPl8 文献标识码tA 文章编号：1001—6600(2007)04—0055—04 作为分类总代价的一部分加以考虑。所谓分类延时代价就是由于未能及时分类而造成的代价。如在医生诊病过程中，为了减少误诊代价，医生常常让病人做一些医疗检查。但许多检查都要等一段时间才能得出结果，这会延误病情的诊断，而延误诊断会引起病情加重、耽误治疗等问题，从而造成某种代价。这种代价就是诊病过程中的延误诊断代价。中的各种代价，其中误分类代价和检查代价是最重要的两种代价。Charles等人o“1讨论了在检查过程中以最小的代价来获取检查例子的缺失值，从而减少分类的总代价。分类问题有许多应用且与代价有关，如网页上的文本分类等o～。分类问题中的另一种代价——分类延时代价尚未得到深入研究，包含分类延时代价的Cost—Sensitive学习是一个新的课题。常情况下，检查代价和误分类代价之间有密切的关系，增加检查代价可减少误分类代价。但由于分类延时含分类延时代价的学习。为此，我们设计一个既“摊薄”延时代价又减少浪费检查代价的检查策略，并给出具体的算法。该算法的目标是使分类过程中的3种代价(误分类代价、检查代价及分类延时代价)之和最小。。 1包含分类延时代价的Cost—Sensitive学习分类延时代价是指在分类过程中由于未能及时完成分类而造成的代价。在现实世界中，许多问题的解决都带有时限性，即要求在规定的时间内解决。若不能及时解决就会造成某些代价，而且时间越长代价越大。在分类问题中有许多因素会影响问题的及时解决，从而造成分类的延时。例如，在医生诊病过程中，许多医疗检查需要一定的时间才能得出结果。本文只考虑由获取检查结果的延时引起的分类延时代价，且分类延时代价是时间的线性函数。具体地说，若完成分类的时间为t。则分类延时代价为A×t，其中^是一个收稿日期：2007．07—12 基金项目：国家自然科学基金资助项目万方数据广西师范大学学报：自然科学版第25眷常数。为了明确表示延时代价，也为了计算方便，我们给每一个检查A都带上一个“延时”时间#d∞)，每一个具体的分类问题都有一个具体的分类延时系数^。于是，由做某项检查A而造成的分类延时代价为 A×d(A)。这个代价将作为Cost—Sensitive学习中的一种代价加以考虑。两种检查策略：顺序检查策略和批检查策略。其中，最有效的是顺序检查策略。顺序检查策略是根据某种准则(如使检查代价与误分类代价之和最小)选定一个检查，等到得出这个检查的结果后，根据检查结果对照模型中的相应数据计算当前结点的误分类代价，再决定选择下一个检查，逐个进行下去，直到最后做出分类判断Is,6]。批检查策略是一次做多个检查。目前尚未看到很好的批检查策略。由于分类延时代价有其限制，后者没有时间限制。 2一个新的检查策略和算法的检查代价、误分类代价与分类延时代价之和最小。这篇文章的研究重点是设计一个效果好的批检查策略，而不讨论建立决策树的过程。决策树的建树原则是扩展“误分

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

Cost-Sensitive学习的一个新课题.pdfVIP