研究生特色精品课程-机器学习 - 智能计算与商空间--主页
增强学习 对于这种控制决策问题,设计一个回报函数(reward function),如果learning agent在决定一步后,获得了较好的结果,那么我们给agent一些回报(比如回报函数结果为正),得到较差的结果,那么回报函数为负。 比如,四足机器人,如果他向前走了一步(接近目标),那么回报函数为正,后退为负。如果我们能够对每一步进行评价,得到相应的回报函数,那么只需要找到一条回报值最大的路径(每步的回报之和最大),就认为是最佳的路径。 多实例学习 半监督学习(比如药物设计方面的应用)。 Ranking学习 需求是事物排序的学习(搜索引擎)。 数据流学习 大量数据快速过滤(有害信息过滤)。 主成分分析PCA PCA是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。计算主成分的目的是将高维数据投影到较低维空间。 PCA function [U,V] = PCA(X, dim) [U,S,V] = svd(X); U = U(:,1:dim); S = S(1:dim,1:dim); V = V(:,1:dim); V = V*S; SVD Singular value decomposition. [U,S,V] = SVD(X) produces a diagonal matrix S, of the same dimension as X and with nonnegative diagonal elements in decreasing order, and unitary matrices U and V so that X = U*S*V. 独立成分分析ICA: 一种利用统计原理进行计算的方法。它是一个线性变换。这个变换把数据或信号分离成统计独立的非高斯的信号源的线性组合。独立成分分析是盲信号分离(blind source separation (BSS))的一种特例。 聚类分析 将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。 Kmeans k-means 算法 接受参数 k ;然后将事先输入的n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。 K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。 假设要把样本集分为c个类别,算法描述如下: (1)适当选择c个类的初始中心; (2)在第k次迭代中,对任意一个样本,求其到c个中心的距离,将该样本归到距离最短的中心所在的类; (3)利用均值等方法更新该类的中心值; (4)对于所有的c个聚类中心,如果利用(2) (3)的迭代法更新后,值保持不变,则迭代结束, 否则继续迭代。该算法的最大优势在于简洁和快速。 算法的关键在于初始中心的选择和距离公式。 [IDX,C,sumd,D] = kmeans(X,k) Description IDX: an n-by-1 vector IDX containing the cluster indices of each point. By default, kmeans uses squared Euclidean distances. C: the k cluster centroid locations in the k-by-p matrix C. sumd: the within-cluster sums of point-to-centroid distances in the 1-by-k vector sumd. D: distances from each point to every centroid in the n-by-k matrix D. 覆盖算法 覆盖算法是在FP算法的基础上发展起来的构造性算法,1995年张铃教授提出的多层反馈神经网络的FP算法和综合算法,就是最初的构造性学习方法,主要针对BP等算法中网络性能差的缺陷,构造吸引中心具有最大吸引域的神经网络构造性算法,包括前馈网络的FP算法和多层反馈网络的FP算法。详见第三章。 集成学习 集成学习(Ensemble Learning)是当前机器学习中主要的热点研究方向之一。它的根本思路是对同一问题使用一系
您可能关注的文档
- 基于决策树的土壤zn 含量预测 - 南京大学国际地球系统科学研究所.pdf
- 知识经济化 - japandesk.ppt
- 运用计算机仿真技术对乒乓球碰撞的研究 - 天津体育学院学报.pdf
- 石油化工研究院绩效考核管理办法 - 中国技能人才服务网.pdf
- 改进遗传算法在桁架拓扑优化中的应用 - 河北工程大学学报(自然科学版).pdf
- 酸化-复合絮凝法预处理煤化工废水 - 环境工程学报.doc
- 长江中路等三个停车场工程岗亭比选招标书 - 南通市政招投标系统.doc
- 基于新型dna 金属化工艺银纳米线的制备dna-templated .pdf
- 水轮发电机组开机特性仿真及分析 - 河海期刊.doc
- 单空位体系多尺度模拟! - 物理学报.pdf
最近下载
- 2025年一级建造师风险登记册在项目全生命周期中的应用专题试卷及解析.pdf VIP
- 《美学原理概要》课件.ppt VIP
- 2025年演出经纪人演出项目融资退出机制设计与法律安排专题试卷及解析.pdf VIP
- 2025年互联网营销师文案的“网感”与“社交货币”打造专题试卷及解析.pdf VIP
- 2025年演出经纪人演出经纪法律责任与权利义务边界专题试卷及解析.pdf VIP
- 基于联邦学习的跨机构医疗数据协作研究框架.pdf VIP
- 股份公司境外公司管理办法.doc VIP
- 2026苏教版高考化学一轮复习第30讲 有机物推断与合成(学用).doc
- 职业道德考试及答案.doc VIP
- 工勤职业道德考试及答案.doc VIP
原创力文档

文档评论(0)