- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于构造超平面的两阶段决策树算法的研究.doc
基于构造超平面的两阶段决策树算法的研究
摘要:如何在测试节点里构造一个恰当的分割超平面是构造决策树的关键,与单变量决策树不同,多变量(倾斜)决策树可以找到与特征轴不垂直的超平面。本文将从几何学角度说明构造测试节点的过程,提出了一种两阶段决策树的算法。
Abstract: How to construct an appropriate partitioning hyperplane in test node is the key to construct a decision tree. Different from decision tree with a single variable, the multi-variable (tilted) decision tree can find a hyperplane which is not perpendicular to the characteristic shaft. This paper will explain the process of constructing the test node and propose a two-stage decision tree algorithm.
关键词:超平面;两阶段;决策树
Key words: hyperplane;two stages;decision tree
中图分类号:TP301.6 文献标识码:A文章编号:1006-4311(2011)08-0168-01
0引言
决策树有着许多不同的应用,其中包括诊断学里面的长度衰退[1]、分等级的多级标签的分类[2]等。在机器学习和数据采集方面,决策树已经成为一种最广泛的模型。一些决策树分类器的算法,比如ID3[3],C4.5[4],CART等,经常被作为评价其他分类器性能的基准。它之所以流行,是因为其形式简单、判断迅速、解释容易和精确度高。
1两阶段决策树算法
1.1 两阶段构造超平面构造多变量决策树的中心问题是,在每个测试节点内对于连续的属性如何研究分割超平面函数如式(1):w1x1+w2x2+…+wnxn+threshold(阈值)=0,这里的X=(x1,x2…xn,1)是一个图形向量,它是由一个常数和n个描叙实例的特征组成的。WT=(w1,w2,…,wn,wn+1)是一个X的参数向量,也可以称为权向量(本文中假设WT是一个单位向量)。为了研究在每个测试决策树节点内构造超平面的过程,首先调整方程式(2):1w1x1+w2x2+…+wnxn=threshold,权向量WT=(w1,w2…wn)可以看作是用函数2构造的超平面的法线方向,然后我们可以将寻找超平面函数2的过程分为两个步骤:首先找出标准向量WT,然后再找出参数阈值。使WT中至少有一个参数不等于0,得到的超平面就会向特征轴倾斜;使WT中只有一个参数不为0,例如WT=(0,0,…,wi,…,0),得到的超平面就会与特征轴垂直。显然,如果在每个超平面的WT中只有一个参数不为0,构造的决策树将会退化为单变量树。为了深入研究这个问题,首先我们作了一个定义1。
定义1设V=(v1,v2…vn)(单位向量)是实例空间P内的一个方向向量,a=(a1,a2…an)是实例空间P内的一点。?坌a,如果a′=∑1?燮i?燮naivi,我们就说a′是a的V成分。
根据定义1可知,如把V当作标准轴,那么a′就是V轴上的值。
命题1设H是用函数(2)构造的分割超平面,假设A和H的交点的标准成分是v,那么v=threshold(阈值)。
证明设a=(a1,a2,…,an)是实例空间内的一点,?坌a∈P,a的标准成分b=∑1?燮i?燮nwiai。设a′=(a,a,…,a)是从a到标准轴的映射点,得到式(3):b=∑1?燮i?燮nwiai=∑1?燮i?燮nwia。
设t=(t1,t2,…,tn)是A和实例空间P的交点,因为WT是实例空间p内的标准向量,所以t=a′。联合(3)式,可以得到:b=∑1?燮i?燮nwia=∑1?燮i?燮nwiti=v。根据方程式(2),得到v=threshold(阈值)。
在权重向量WT内,如果只有一个参数不是0,例如WT=(0,0,…,wi,…,0),那么命题1中法线方向是准确的一个实例空间特征。因此,单变量决策树满足命题1。从这个角度来看,我们的框架是单变量决策树的延伸。此外,一旦发现有法线方向,就可以简单地解决超平面阈值:计算每个实例的标准成分作为一维空间值,然后根据一些标准(如基尼),寻找作为函数(2)阈值的最佳分割阈值。
1.2 两阶段决策树算法通过在1.1内的分析,寻找超平面函数的过程可以划分为两个阶
您可能关注的文档
最近下载
- 一株安全性好、免疫原性好的传染性喉气管炎病毒天然弱毒株及应用.pdf VIP
- 成年女性压力性尿失禁护理干预-中华护理学会新发团标.pdf VIP
- kbg线管CECS100-98国标 接地规范要求.docx VIP
- 住培出科考核分层分类.docx VIP
- 民航CAAC多旋翼+垂起固定翼驾驶执照理论参考试题库(含答案).docx
- Unit 6 When disaster strikes Developing ideas课件 外研版(2025)英语八年级上册.pptx VIP
- 成年女性压力性尿失禁护理干预.pptx VIP
- 【精编版】二级医院医疗设备配置标准4.doc VIP
- 2025广西公需科目考试答案(3套涵盖95-试题)一区两地一园一通道建设人工智能时代的机遇与挑战.docx VIP
- 矿用灾区电话KTT9.ppt VIP
文档评论(0)