- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于逻辑描述的决策树算法及其prolog实现-云南大学
云南大 学学报 ( 自然科 学版) , 2005 , 27 ( 3) : 211~215 CN 53 - 1045/ N ISSN 0258 - 7971
Journal of Yunnan University
基于逻辑描述的决策树算法及其 Prolog 实现
1 2 1
赵 爽 , 文 瑾 , 施心陵
( 1. 云南大学 信息学院 ,云南 昆明 65009 1 ;2 . 昆明大学 电子信息与机械工程系 ,云南 昆明 65003 1)
摘要 :决策树算法是数据挖掘领域的重要算法之一. 文章首先对决策树算法的数据进行逻辑描述 ,然后使
用保险公司客户数据来构建决策树 ,利用 Prolo g 语言实现了基于逻辑描述的 ID3 算法 ,尝试了用逻辑推理方法
解决数据挖掘问题 ,并对结果进行了分析.
关键词 :决策树 ;逻辑描述 ;Prolog
( )
中图分类号 : TP 3 11 文献标识码 :A 文章编号 :0258 - 797 1 2005 03 - 02 11 - 05
在常用的数据挖掘算法中,决策树技术由于描 树型结构 ,它利用树结构将数据进行分类. 树的一
述简单 ,分类速度快 ,容易生成可理解的分类规则而 个叶结点就代表属于同一类型的数据子集或类 ,树
得到广泛的应用和研究. Quinlan 提出了著名的 ID3 的每一个内部节点表示在一个数据属性上的测试 ,
学习算法[ 1] . ID3 算法定义属性值是离散非数值型 根据数据属性的不同取值建立树的分支 ,在每个分
的,对于连续属性及数值属性则需要进行离散化处 支子集中重复建立下层结点和分支 ,便可生成一棵
理. ID3 算法采用信息增益作为启发知识来帮助选 决策树[5~7 ] .
择合适的分枝属性 ,但是其启发式函数并不是最优 决策树的构造一般分为 2 步 :决策树构建和决
的,启发式函数的计算依赖于属性取值的数 目较多 策树剪枝. 决策树构建 :通过递归的对训练数据集
的特征 ,而属性取值较多的属性不一定最优 ,因此属 进行划分 ,直到每个子集数据都属于同一类 ,如图
性取值的多少会直接影响对分支属性的选择[2 ,3 ] . 在 1 所示. 决策树剪枝 :对决策树进行优化处理 ,去掉
数据挖掘中,属性值的最佳分割阈值是使差异系数 噪音数据或孤立点引起的分枝异常.
下降最快的分割值 ,它保证在同一组内目标变量的
取值具有最小的差异性. 在数据挖掘软件中,差异系
数多采用基尼系数[4 ] . 但差异系数并不能控制属性
取值的数目是最佳的,本文提出用逻辑描述来对连
续属性及数值属性进行离散化处理 ,并使用文献
提供的保险公司客户数据建立决策树. 该数据集有
图 1 决策树的构建
( )
5 822 个样本 86 个属性 变量 ,从数据集中选取部
Fig. 1 Building decision tree
分数据作为训练数据集来构建决策树 ,然后利用
Prolog 语言实现了基于逻辑描述的 ID3 算法.
您可能关注的文档
- 即同目的基因变性dna互补彼此杂交的mrna.ppt
- 极危物种金头闭壳龟现状和保护对策-北大未名bbs-北京大学.doc
- 极地冰盖冰雷达探测技术的发展综述-极地之门.pdf
- 极低频高压脉冲电场对萌发绿豆干旱伤害的缓解作用-干旱地区农业研究.pdf
- 级串联氧化塘设计优化模型-环境科学学报.pdf
- 吉林华桥外国语学院教案用纸台纸.doc
- 及其广义算法研究.pdf
- 激光原理课程试验教学大纲-教师教育学院.doc
- 激光调制法的热敏探测器时间常数测试系统-激光与红外.pdf
- 激光拍频波加速器的参数选择-物理学报.pdf
- 基于灵敏度与相关性的综合负荷模型参数优化辨识策略-电工技术学报.pdf
- 基于邻域的大规模图数据动态分割算法①-计算机系统应用.pdf
- 基于联合稀疏谱重构的ppg信号降噪算法.pdf
- 基于粒子群优化算法的支持向量机参数选择及其应用-控制理论与应用.pdf
- 基于粒子群算法的mimocdma平坦衰落信道均衡器-智能系统学报.pdf
- 基于粒子群算法的universumsvm参数选择-北京工业大学学报.pdf
- 基于离散小波变换的地震资料自适应高频噪声压制-物探与化探.pdf
- 基于离散动态凸化方法的vlsi电路k路划分adiscretedynamic.pdf
- 基于开关矩阵拓扑的蓄电池组均衡控制策略-电源学报.pdf
- 基于扩展ca模型的土地利用变化时空模拟研究-资源科学.pdf
最近下载
- 25道广东电力发展新能源工程师岗位面试问题考察点及参考回答.pdf
- 挤压综合征课件.ppt VIP
- 前列腺癌诊疗指南更新.pptx VIP
- urit全自动尿液有形分析仪临床使用2014.pptx VIP
- Samsung三星条形音响 HW-Q600F(2025)使用手册中文版.pdf
- 统编版道德与法治四年级上册大单元教学计划 教学进度表.pdf
- 2024年重庆中烟工业有限责任公司考试真题试卷及答案.docx VIP
- 2025-2026学年第一学期开学典礼校长致辞:乘金秋之风,启成长新程.docx
- EXPEC2000挥发性有机物(VOCs)在线监测系统用户手册.pdf VIP
- 小学教师专业发展-PPT课件(全).pptx
文档评论(0)