- 5
- 0
- 约3.09千字
- 约 18页
- 2017-12-16 发布于天津
- 举报
选择性集成学习算法-厦门大学.ppt
16/18 libD3C问题 : (1)对于处理数据比较大问题,会耗费相当长的时间,容易产生内存溢出。 (2) Linux 和 Mac环境下的使用(已解决)。 (3)其他一些小问题(已解决)…… 17/18 (1)从libD3C中学会了基础的java知识,以及Eclipse的基本操作。 (2)从libD3C中学会了如何调用,以及集成自己的分类器到weka软件。 (3)对于ML,DM…有了一定的了解。 学习 : 18/18 谢 谢 欢迎各位批评指正 * In most cases, users need access to more information to make sense of a topic which is often given as a set of top-ranked keywords. Simply display top-ranked keywords usually make user confused and we need to summarize this event to facilitate user understand this event. * To solve this problem, we should overcome the following two difficulties: Retrieval : How to retrieve high-quality tweets about this event? Sub-event : How to detect all sub-events in a online manner? * * To solve this problem, we should overcome the following two difficulties: Retrieval : How to retrieve high-quality tweets about this event? Sub-event : How to detect all sub-events in a online manner? * To solve this problem, we should overcome the following two difficulties: Retrieval : How to retrieve high-quality tweets about this event? Sub-event : How to detect all sub-events in a online manner? * 1/18 选择性集成学习算法 报告人:郭佳盛 厦门大学数据挖掘研究组 * 2/18 [1] 张春霞, 张讲社. 选择性集成学习算法综述[J]. 计算机学报, 2011, 34(8): 1399-1410. 选择性集成学习算法 改善集成学习的预测效果 提高集成 学习的预测速度 降低存储需求 在假定已生成的的多个基分类器基础上,基于某种策略只选择一部分用于构建最终的集成。 (1)基于聚类的方法 : 3/18 (2)基于排序的方法: (3)基于优化的方法: (4)其他(动态选择和循环集成): 策略方法 : 4/18 基于聚类的方法 : C9 C3 C1 C2 C9 C9 C3 C9 C2 C3 C9 Out1 Out2 Out3 Out10 Out9 KMeans Cluster1 Cluster2 Cluster3 Out1 Out2 Out1 Out3 Out2 Out1 Out1 Out2 Out1 Out3 Out2 Out1 Out9 Out3 Out2 Out1 Out10 Out3 Out2 Out9 Out10 Out3 Out2 Out9 Out10 Out3 Out2 C10 C9 C3 C1 C2 Data 5/18 基于排序的方法: Step1: 基于某种准则对基分类器进行排序(比如Acc)。 Step2: 采用合适的停止准则(比如事先规定选取基分类器个数) 选取一定数量的基分类器。 6/18 基于优化的方法: 借助优化算法比如(粒子群算法,遗传算法…)剔除不必要的基分类器,选择最优的基分类器子集。 遗传算法 适应函数f(w)=1/E 7/18 基于模拟退火的选择性集成算法(EBSA): SA 8/18 其他(分类器的动态选择和循环集成): (1)构造出一定数量的候选分类器,并计算互补指数,对分类器进行排序 [1]郝红
原创力文档

文档评论(0)