- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于增量式时间序列和最佳任务调度的Web数据聚类算法.doc
一种基于增量式时间序列和最佳任务调度的Web数据聚类算法
摘 要: 为了实现Web服务请求数据的快速聚类,并提高聚类的准确率,提出一种基于增量式时间序列和最佳任务调度的Web数据聚类算法。该算法进行了Web数据在时间序列上的聚类定义,并采用增量式时间序列聚类方法。先通过数据压缩形式降低Web数据的复杂性,再进行基于服务时间相似性的时间序列数据聚类; 最后针对Web集群服务的最佳服务任务调度问题,通过以服务器执行能力为标准来分配服务任务。仿真实验结果表明,相比基于网格的高维数据层次聚类算法和基于增量学习的多目标模糊聚类算法,该文的算法在聚类时间、聚类精度、服务执行成功率、聚类失真度上均获得了更好的性能。
关键词: Web数据聚类; 增量式时间序列; 数据压缩; 最佳任务调度
中图分类号: TN911?34; TP393 文献标识码: A 文章编号: 1004?373X(2016)14?0004?05
A Web data clustering algorithm based on incremental time series and
optimal task scheduling
CHEN Ke, KE Wende, XU bo
(Department of Computer Science and Technology, Guangdong University of Petrochemical Technology, Maoming 525000, China)
Abstract: In order to achieve fast clustering of Web service request data and improve accuracy of the clustering, a Web data clustering algorithm based on incremental time series and optimal task scheduling is proposed in this paper. The Web data clustering definition in the time sequence and time series incremental clustering method are adopted in the algorithm. The complexity of Web data is reduced first in data compression form, and then the time series data clustering based on service time similarity is conducted. Finally, for the problem of the best service task scheduling in Web cluster services, the executive capacity of the server is taken as a standard to dispatch the service tasks. The simulation results show that in comparison with high?dimensional data grid?based hierarchical clustering algorithm and multi?objective fuzzy clustering algorithm based on incremental learning, the algorithm proposed in this paper has obtained better results in the aspects of time clustering, clustering accuracy, success rate of all service execution and distortion degree.
Keywords: Web data clustering; incremental time series; data compression; optimal task scheduling
0 引 言
随着互联网技术的发展,Web服务数量的增长速度不断加快,对于越来越多的Web服务请求,如何保障用户所需要响应速度以及查询准确度来说是个巨大的挑战[1?2]。网络系统在保障用户的Web服务请求时,通常采用数据挖掘的方法处理大规模的Web服务请求数据[3]。
聚类算法
文档评论(0)