- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
机器学习概论课程实验决策树算法-Read
《机器学习概论》课程实验:决策树算法
一.实验内容
1.目标:
实现一个决策树算法,预测一个人的年收入能否超过 50K
2 .数据:
在这个实验中,我们使用 UCI (University of California, Irvine )提供的机器学习资源中
的Adult 数据库。该数据库中,每个样本数据有 14 个属性(6 个连续属性,8 个离散属性)
以及一个所属分类的标记。为了降低实验的难度,我们已经去掉了6 个连续属性。另外,还
去掉了其中有属性缺失的样本。因此所有数据样本均有 8 个离散属性。
在实验中用到的数据在两个文件中:训练数据在文件 adult.train.10k.discrete 中,测试
数据文件为 adult.test.10k.discrete,每个文件中有 10,000 个样本。两个文件及本说明打包压
缩为 general.zip 文件。
分类标记:在每个样本的最前面给出 50K, =50K.
属性:
(1)workclass: (8 values) Private, Self-emp-not-inc, Self-emp-inc, Federal-gov, Local-gov,
State-gov, Without-pay, Never-worked.
(2 )education: (16 values) Bachelors, Some-college, 11th, HS-grad, Prof-school,
Assoc-acdm, Assoc-voc, 9th, 7th-8th, 12th, Masters, 1st-4th, 10th, Doctorate, 5th-6th, Preschool.
(3 )marital-status: (7 values ) Married-civ-spouse, Divorced, Never-married, Separated,
Widowed, Married-spouse-absent, Married-AF-spouse.
(4 ) occupation: (14 values ) Tech-support, Craft-repair, Other-service, Sales,
Exec-managerial, Prof-specialty, Handlers-cleaners, Machine-op-inspct, Adm-clerical,
Farming-fishing, Transport-moving, Priv-house-serv, Protective-serv, Armed-Forces.
(5 )relationship: (6 values )Wife, Own-child, Husband, Not-in-family, Other-relative,
Unmarried.
(6 )race: (5 values )White, Asian-Pac-Islander, Amer-Indian-Eskimo, Other, Black.
(7 )sex: (2 values ) Female, Male.
(8 )native-country(region): (41 values ) United-States, Cambodia, England, Puerto-Rico,
Canada, Germany, Outlying-US(Guam-USVI-etc), India, Japan, Greece, South, China, Cuba, Iran,
Honduras, Philippines, Italy, Poland, Jamaica, Vietnam, Mexico, Portugal, Ireland, France,
Dominican-Republic, Laos, Ecuador, Taiwan, Haiti, Columbia, Hungary, Guatemala, Nicaragua,
Scotland, Thailand, Yugoslavia, El-Salvador, TrinadadTobago, Peru, Hong, Holand-Netherlands.
3 .实验要求
(1)用训练数据和你的程序,学习一个决策
您可能关注的文档
- 暖通实习报告下载.doc
- 暖通空调实践报告.doc
- 暨南大学数学学科2015年硕士研究生入学考试自命题科目高等代数.PDF
- 暖通行业钎焊解决方案.PDF
- 暨南大学附属第一医院人才引进实施办法试行.PDF
- 曲线拟合背景场在提取大气重я波参数中的缺陷-气象科学.PDF
- 更大冷量更低能耗适用于大型冷水机组和屋顶机-Danfoss.PDF
- 更安全世界简报-Saferworld.PDF
- 更完善的G20和全新G7新世纪的需要Bruegel.PDF
- 曲轴数控复合加工技术-青海第二机床制造有限责任公司.PDF
- 难点详解鲁教版(五四制)6年级数学下册期末测试卷带答案详解(考试直接用).docx
- 难点详解鲁教版(五四制)6年级数学下册期末试题【培优】附答案详解.docx
- 难点解析鲁教版(五四制)7年级数学下册期末试题及完整答案详解(全国通用).docx
- 难点解析鲁教版(五四制)7年级数学下册期末试题含完整答案详解(名师系列).docx
- 难点解析鲁教版(五四制)7年级数学下册期末试题含完整答案详解【全国通用】.docx
- 难点解析鲁教版(五四制)7年级数学下册期末试卷(突破训练)附答案详解.docx
- 难点解析鲁教版(五四制)7年级数学下册期末试卷(能力提升)附答案详解.docx
- 难点详解京改版数学9年级上册期中试卷附参考答案详解【突破训练】.docx
- 难点解析鲁教版(五四制)7年级数学下册期末试题含完整答案详解(有一套).docx
- 难点解析鲁教版(五四制)7年级数学下册期末试卷带答案详解(夺分金卷).docx
文档评论(0)