考虑数据分布的K.docVIP

下载本文档

1
0
约1.71万字
约 8页
2018-03-16 发布于天津
举报

考虑数据分布的K.doc

考虑数据分布的K

附件2 论文中英文摘要作者姓名：吴俊杰论文题目：考虑数据分布的K-均值聚类研究作者简介：吴俊杰，男，1979年7月出生，2002年9月师从于清华大学陈剑教授，于2008年1月获博士学位。中文摘要商务智能通常被理解为将企业中现有的数据转化为知识，帮助企业做出明智的业务经营决策的工具。数据挖掘是商务智能的核心技术之一。实践表明，数据挖掘已经被广泛应用于客户细分和客户行为分析、目标市场定位、金融价格预测和风险管理、工作流管理、欺诈检测等商业领域，对企业的决策支持、成本管理、组织协同等提供了极大的帮助。随着信息搜索、电子商务和Web 2.0的迅猛发展，数据挖掘将为信息抽取、管理与使用发挥更大的作用。聚类分析是数据挖掘研究的重要子领域。聚类分析为探索未知的数据结构提供帮助，并能成为一系列数据分析的起点。聚类分析已长时间在市场营销、生产监测、信息检索与分类等商业领域发挥重要作用。在聚类分析的众多算法中，K-均值算法因其简单、高效、鲁棒、数据适应性强等优点得到了非常广泛的应用。许多文献已经对K-均值算法的特点进行了深入研究，并针对海量数据、高维数据、流式数据、噪声数据等现实问题提出了许多改进方法。然而，无论从理论、算法还是实践层面，考虑到商务实践中大量数据的不均衡分布特征，仍有很多极具挑战性的问题亟待解决：是否所有适于K-均值聚类的距离函数都具有统一的泛化形式？是否数

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

考虑数据分布的K.docVIP