- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于高维空间映射的k调和均值聚类方法
(19)中华人民共和国国家知识产权局 *CN102426631A*
(12)发明专利申请
(10)申请公布号 CN 102426631 A
(43)申请公布日 2012.04.25
(21)申请号 201110341012.7
(22)申请日 2011.11.01
(71)申请人 南京理工大学常熟研究院有限公司
地址 215513 江苏省常熟市经济技术开发区
科创园研究院路5 号
(72)发明人 王建宇 康其桔 马鹏飞 孙丽娟
陆源 何新 王凯 田乃鲁
(51)Int.Cl.
G06F 19/00 (2011.01)
权利要求书 1 页 说明书 3 页 附图 1 页
(54)发明名称
一种基于高维空间映射的K 调和均值聚类方
法
(57)摘要
本发明公开一种基于高维空间映射的K 调
和均值聚类方法,本方法假设样本数据已具有空
间向量形式,将该空间向量数据映射至更高维的
空间后引入K 调和均值进行数据聚类,具体步骤
如下:(1)数据处理;(2)选择数据的初始化聚类
中心;(3)将距离测度映射至高维空间;(4)将映
射后的距离测度带入计算数据样本的调和距离;
(5) 以该调和距离为距离测度进行K 均值聚类;
(6)结果输出;本发明可以有效改善现有K 均值算
法对初值的敏感性,并大大改善了因数据混叠而
引起的聚类误差。
A
1
3
6
6
2
4
2
0
1
N
C
CN 102426631 A 权 利 要 求 书
CN 102426639 A 1/1 页
1. 一种基于高维空间映射的K 调和均值聚类方法,其特征在于包括如下步骤:
(1)将原始数据处理为空间向量形式;
(2)选择数据的初始化聚类中心;
(3)将距离测度映射至高维空间;
(4)将映射后的距离测度带入计算样本点的调和距离;
(5) 以该调和距离为距离测度进行K 均值聚类;
(6)结果输出。
2. 根据权利要求1 所述的基于高维空间映射的K 调和均值聚类方法,其特征在于:所
述步骤 (3)中的距离测度为夹角余弦值。
3. 根据权利要求2 所述的基于高维空间映射的K 调和均值聚类方法,其特征在于:所
述步骤 (3)中采用Mercer 核函数将夹角余弦值映射到高维空间。
2
CN 102426631 A 说 明 书
CN 102426639 A 1/3 页
一种基于高维空间映射的K调和均值聚类方法
技术领域
[0001] 本发明涉及计算科学和智能信息处理领域,尤其是对数据集进行聚类的技术,具
体地说是一种基于高维空间映射的K 调和均值聚类方法。
背景技术
[0002] 聚类分析作为一种数据预处理方法,是进一步分析和处理数据的基础,聚类分析
在处理大规模数据中成为不可或缺的重要工具。目前,最常用的数据聚类方法是K 均值聚
类方法,实验证明,该方法虽能在一定程度上解决智能信息处理过程中的聚类需求,但是该
方法对初始化聚类中心的随机性非常敏感,而且无法解决实际工程应用中的数据混叠问
题,所以该方法已经不能适用于当前大规模复杂数据聚类的需求。因此迫切需求一种对初
始化聚簇中心不甚敏感且能解决数据混叠问题的聚类方法。
发明内容
[0003] 本发明的目的在于提供了一种基于高维空间映射的K 调和均值聚类方法,该方法
能够使大规模复杂数据聚类结果稳
您可能关注的文档
- 山东教师资格认定指导中心函件.pdf
- 山东文物考古研究所菏泽文物管理处定陶文管处.pdf
- 山东枣庄科学技术进步奖申报书.doc
- 山东济南幼儿师范高等专科学校.doc
- 山东炼化企业之间的竞合博弈分析analysisoncompetitionand.pdf
- 山东煤炭总量控制路径.pdf
- 山东煤矿生产能力情况表.pdf
- 山东猪腹泻病例中vtmqestq和vq的感染调查与-中国畜牧兽医.pdf
- 山东煤矿生产能力情况截至2016年12月底.pdf
- 山东着名商标认定和保护办法.pdf
- 《GB/T 32151.42-2024温室气体排放核算与报告要求 第42部分:铜冶炼企业》.pdf
- GB/T 32151.42-2024温室气体排放核算与报告要求 第42部分:铜冶炼企业.pdf
- GB/T 38048.6-2024表面清洁器具 第6部分:家用和类似用途湿式硬地面清洁器具 性能测试方法.pdf
- 中国国家标准 GB/T 38048.6-2024表面清洁器具 第6部分:家用和类似用途湿式硬地面清洁器具 性能测试方法.pdf
- 《GB/T 38048.6-2024表面清洁器具 第6部分:家用和类似用途湿式硬地面清洁器具 性能测试方法》.pdf
- 《GB/T 18238.2-2024网络安全技术 杂凑函数 第2部分:采用分组密码的杂凑函数》.pdf
- GB/T 18238.2-2024网络安全技术 杂凑函数 第2部分:采用分组密码的杂凑函数.pdf
- 《GB/T 17215.686-2024电测量数据交换 DLMS/COSEM组件 第86部分:社区网络高速PLCISO/IEC 12139-1配置》.pdf
- GB/T 13542.4-2024电气绝缘用薄膜 第4部分:聚酯薄膜.pdf
- 《GB/T 13542.4-2024电气绝缘用薄膜 第4部分:聚酯薄膜》.pdf
文档评论(0)