网站大量收购独家精品文档,联系QQ:2885784924

数据挖掘与R软件.pdf

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘与R软件

数据挖掘与R语言 预测海藻数量 苏州大学 唐煜 问题描述与目标 有害藻类对河流生态环境具有破坏性 一年的不同时间 收集欧洲多条不同河流的水样 测定不同的化学性质 (便宜、方便) 测定7种有害藻类的存在频率 ( 昂贵、缓慢) 目标 构建基于化学性质预测藻类的模型 了解影响藻类频率的因素 SUDA 2 数据说明 •来源:来自于ERUDIT研究网络 被用于1999的COIL国际数据分析竞赛 /ml/ (Coil 1999 Competition Data) •两个数据集:训练样本(200个)和测试样本(140个) 3个名义变量+8个水样化学参数+7种有害藻类的频率 SUDA 3 变量含义--名义变量 1 水样收集的季节 (春、夏、秋、冬 ) 2 、小 收集样本的河流大小 (大、中 ) 3 河水速度 (高、中、低) SUDA 4 变量含义--化学参数 1 最大PH值 (mxPH) 2 最小含氧量 (mnO2) 3 平均氯化物含量 (CL) 4 平均硝酸盐含量 (NO3) 5 平均氨含量 (NH4) 6 平均正磷酸盐含量 (oPO4) 7 平均磷酸盐含量 PO4 8 均匀叶绿素含量 (Chla) SUDA 5 加载数据 载入R语言的两种方法 R添加包 install.packages(DMwR) 生成数据集 read.table library(DMwR) algae 从文件中读入 SUDA 6 从文件中读入数据 http://www.liaad.up.pt/~ltorgo/DataMiningWithR/ 1 Analysis.txt 2 Eval.txt 3 Sols.txt algae - read.table(Analysis.txt, + header=F, dec=., +

文档评论(0)

f8r9t5c + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档