基于粗糙集市场潜在客户预测模型.docVIP

下载本文档

2
0
约2.97千字
约 8页
2018-06-01 发布于福建
举报
版权申诉

基于粗糙集市场潜在客户预测模型.doc

1、本文档共8页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于粗糙集市场潜在客户预测模型

基于粗糙集市场潜在客户预测模型　　摘要:论文提出基于粗糙集理论的市场潜在客户预测模型，研究并解决潜在客户信息决策系统的建立和使用的方法。　　关键词:粗糙集潜在客户预测模型　　　　 ??一、问题提出　　随着市场竞争加剧大，如何用历史交易数据预测市场潜在客户，成为研究热点。粗糙集是用已有知识刻画不确定或不精确的知识，确定给定问题的近似域。运用粗糙集预测潜在客户可提高发现效率。　　 ??二、粗糙集相关概念　　（一）近似集　　设?X∈U?，?U?上的一个等价关系用?R?表示。当集合?X?能表示成某些?R?基本知识的并集时，称集合?X?为?R?的精确集；否则，集合?X?只能以逼近的方式刻画，称集合?X?是?R?粗糙集或不可定义集。　　?包含X的最小R精确集称为X 的R上近似，记为R(X)；X所包含的最大R精确集称为X 的R下近似，记为?R?-(X)。即：R(X)={a∈U｜［a］?R∩X≠φ} 　　；R-(X)={a∈U｜［a］?R}?X 　　；称BN?R(X)=R(X)-R-(X) 　　为X的R边界区域。? 　　（二）信息系统与决策表　　设四元组?S=(U,A,V,F)?，其中?S?为知识表达系统，?U={X?1,X?2,…X?n}?是对象的非空有限集合，为论域：?A={a?1,a?2,…,a?m}?是属性的非空有限集合；?V=U?a∈A?V?n?是属性值域；?f∶V×A?V?为信息函数，?a∈A,x∈U,f(x,a)∈V?a。? 　　?具有条件属性C和决策属性D，A=C∩D，C∩D=φ?的信息系统称为决策表。　　（三）属性的依赖性与重要度　　在?S=(U,A,V,f)? 　　中属性?D对属性C?的依赖度为：?γ?c(D)=｜POS?c(D)｜｜U｜? 　　　　?其中POS?c(D)表示D在U/IND(C)上的正区域。γ?c(D)给出属性C用分类特性对分类U／D的全部信息。? 　　?在决策系统S=(U,A,V,f)中，a∈C的属性重要度为：? 　　?SGF??(C,D)?(a)=γ?C(D)-γ??C-{a}?(D)γ?C(D)? 　　　　?其中SGF??(C,D)?(a)∈［0,1］，若SGF?(C,D)(a)=0，则属性a对于D可省略；若SGF??(C,D)?(a)≠0，则属性a对于D不可缺少。SGF??(C,D)?(a) 　　值越大，属性a对于D就越重要。? 　　 ??三、预测模型的设计　　基于粗糙集预测潜在客户步骤：　　1）明确系统目标，建立相关数据集；　　2）数据预处理：对数据包含的空值进行处理，如填入、删除或连续属性离散化；　　3）计算条件属性集的约简；　???4）产生分类规则，选择和过滤规则。　　（一）数据预处理　　1.决策表补齐　　对不完备的信息表补齐遗漏数据的方法：　　1）删除缺损数据，得到完备的数据表，此方法局限于信息表数据量极大而缺损数据量相对很小时；　　2）将缺损数据作为特殊属性值处理；　　3）通过统计方法，根据决策表中各属性值取值的记录情况估计缺损数据；　　4）运用粗糙集建立数据间的不可分辨关系，补齐缺损数据。　　2.不完备数据分析方法　　空缺数据值的填补要使完整化后的信息系统产生的分类规则具有尽可能高的支持度，尽量集中产生的规则，使信息系统的其他相似对象与具有遗漏值的对象的属性值之间高度一致，使属性值之间差异较小。　　3.连续属性值的离散化　　运用粗糙集处理决策表时要求用离散数据表达属性值。把连续属性的取值区间划分成若干小区间称为离散化，每个小区间有相应离散符号。可根据某种规则由系统自动划分或由领域专家根据经验划分。　　离散化后决策表要尽量保持较少的空间维数，即剩余属性值的个数；且离散化后决策表不能改变原有决策表的不可辨识关系，即尽量减少信息丢失。　　（二）数据约简　　1.属性约简　　在知识库的分类或决策能力不变条件下，删除其中冗余知识称为属性约简，约简后的属性被应于导出分类规则。约简后属性个数越少，表明相对应的分类规则所需考虑的因素越少。属性值组合数目最小的约简为最优属性约简。　　2.一般的属性约简算法　　1）设决策表的条件属性集为C，决策属性集为D。对于每个条件属性a?i∈C，计算该属性重要度r?c(D)-r??c-a?(D)。　　2）若r?c(D)-r??c-a?i?(D)=0，则该属性a?i相对于决策分类是冗余的，可删除。　　3）反之属性a?i相对于决策分类是必要的，不可删除。　　4）属性集合不再变化时，输出结果。　　（三）分类规则约简　　1.分类规则表现形式　　在决策表?S=(U,A,V,f)?