网站大量收购独家精品文档,联系QQ:2885784924

机器学习概论课程实验决策树算法-Read.PDF

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
机器学习概论课程实验决策树算法-Read

《机器学习概论》课程实验:决策树算法 一.实验内容 1.目标: 实现一个决策树算法,预测一个人的年收入能否超过 50K 2 .数据: 在这个实验中,我们使用 UCI (University of California, Irvine )提供的机器学习资源中 的Adult 数据库。该数据库中,每个样本数据有 14 个属性(6 个连续属性,8 个离散属性) 以及一个所属分类的标记。为了降低实验的难度,我们已经去掉了6 个连续属性。另外,还 去掉了其中有属性缺失的样本。因此所有数据样本均有 8 个离散属性。 在实验中用到的数据在两个文件中:训练数据在文件 adult.train.10k.discrete 中,测试 数据文件为 adult.test.10k.discrete,每个文件中有 10,000 个样本。两个文件及本说明打包压 缩为 general.zip 文件。 分类标记:在每个样本的最前面给出 50K, =50K. 属性: (1)workclass: (8 values) Private, Self-emp-not-inc, Self-emp-inc, Federal-gov, Local-gov, State-gov, Without-pay, Never-worked. (2 )education: (16 values) Bachelors, Some-college, 11th, HS-grad, Prof-school, Assoc-acdm, Assoc-voc, 9th, 7th-8th, 12th, Masters, 1st-4th, 10th, Doctorate, 5th-6th, Preschool. (3 )marital-status: (7 values ) Married-civ-spouse, Divorced, Never-married, Separated, Widowed, Married-spouse-absent, Married-AF-spouse. (4 ) occupation: (14 values ) Tech-support, Craft-repair, Other-service, Sales, Exec-managerial, Prof-specialty, Handlers-cleaners, Machine-op-inspct, Adm-clerical, Farming-fishing, Transport-moving, Priv-house-serv, Protective-serv, Armed-Forces. (5 )relationship: (6 values )Wife, Own-child, Husband, Not-in-family, Other-relative, Unmarried. (6 )race: (5 values )White, Asian-Pac-Islander, Amer-Indian-Eskimo, Other, Black. (7 )sex: (2 values ) Female, Male. (8 )native-country(region): (41 values ) United-States, Cambodia, England, Puerto-Rico, Canada, Germany, Outlying-US(Guam-USVI-etc), India, Japan, Greece, South, China, Cuba, Iran, Honduras, Philippines, Italy, Poland, Jamaica, Vietnam, Mexico, Portugal, Ireland, France, Dominican-Republic, Laos, Ecuador, Taiwan, Haiti, Columbia, Hungary, Guatemala, Nicaragua, Scotland, Thailand, Yugoslavia, El-Salvador, TrinadadTobago, Peru, Hong, Holand-Netherlands. 3 .实验要求 (1)用训练数据和你的程序,学习一个决策

您可能关注的文档

文档评论(0)

sunshaoying + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档