- 161
- 0
- 约6.25千字
- 约 8页
- 2017-05-01 发布于湖北
- 举报
用户流量分析模型
深圳天源迪科信息技术股份有限公司
版本:1.0
安徽联通用户流量分析模型
2012 年 01 月 12 日
1
深圳天源迪科信息技术股份有限公司
文件建立/修改记录
日期 版本 建立/修改内容 建立/修改人 审核人 批准人
2012-01-12 1.0 建立 孙宏方
2
深圳天源迪科信息技术股份有限公司
一、 工具选择与算法选择
选用 Clementine 建模工具里面的决策树算法 C5.0 对本网用户的流量使
用情况进行分析,类别划分。
二、决策树算法介绍
决策树算法构造决策树来发现数据中蕴涵的分类规则.如何构造精
度高、规模小的决策树是决策树算法的核心内容。决策树构造可以分两步
进行。第一步,决策树的生成:由训练样本集生成决策树的过程。一般情
况下,训练样本数据集是根据实际需要有历史的、有一定综合程度的,用
于数据分析处理的数据集。第二步,决策树的剪技:决策树的剪枝是对上
一阶段生成的决策树进行检验、校正和修下的过程,主要是用新的样本数
扼集(称为测试数据集)中的数据校验决策树生成过程中产生的初步规则,
将那些影响预衡准确性的分枝剪除。
1)树以代表训练样本的单个结点开始。
2)如果样本都在同一个类.则该结点成为树叴,并用该类标记。
原创力文档

文档评论(0)