考虑数据分布的K.docVIP

  • 1
  • 0
  • 约1.71万字
  • 约 8页
  • 2018-03-16 发布于天津
  • 举报
考虑数据分布的K

附件2 论文中英文摘要 作者姓名:吴俊杰 论文题目:考虑数据分布的K-均值聚类研究 作者简介:吴俊杰,男,1979年7月出生,2002年9月师从于清华大学陈剑教授,于2008年1月获博士学位。 中 文 摘 要 商务智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。数据挖掘是商务智能的核心技术之一。实践表明,数据挖掘已经被广泛应用于客户细分和客户行为分析、目标市场定位、金融价格预测和风险管理、工作流管理、欺诈检测等商业领域,对企业的决策支持、成本管理、组织协同等提供了极大的帮助。随着信息搜索、电子商务和Web 2.0的迅猛发展,数据挖掘将为信息抽取、管理与使用发挥更大的作用。 聚类分析是数据挖掘研究的重要子领域。聚类分析为探索未知的数据结构提供帮助,并能成为一系列数据分析的起点。聚类分析已长时间在市场营销、生产监测、信息检索与分类等商业领域发挥重要作用。在聚类分析的众多算法中,K-均值算法因其简单、高效、鲁棒、数据适应性强等优点得到了非常广泛的应用。许多文献已经对K-均值算法的特点进行了深入研究,并针对海量数据、高维数据、流式数据、噪声数据等现实问题提出了许多改进方法。然而,无论从理论、算法还是实践层面,考虑到商务实践中大量数据的不均衡分布特征,仍有很多极具挑战性的问题亟待解决: 是否所有适于K-均值聚类的距离函数都具有统一的泛化形式? 是否数

文档评论(0)

1亿VIP精品文档

相关文档