- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机器学习理论在高中自主学习中的应用.doc
机器学习理论在高中自主学习中的应用
摘 要 伴随互联网发展,以云计算和大数据为代表的信息技术,已经开始渗透至各个领域。以深度学习为代表的机器学习技术,在诸多行业逐步开始发挥革命性作用。而在教育领域,大部分学校依然遵循传统的教育模式,教学参与者如学校、教师、学生和家长普遍感到异常辛苦。本文就利用基于互联网和大数据的最新机器学习技术,实现自主学习,进而提高高中阶段教学效率的可能性和应用过程进行探讨。
关键词 机器学习 统计 数据挖掘 互联网
中图分类号:TP181 文献标识码:A
1机器学习技术介绍
根据南京大学教授周志华的《机器学习和数据挖掘》对机器学习的定义,“机器学习”是人工智能的核心研究领域之一,其最初的研究动机是为了让计算机系统具有人的学习能力以便实现人工智能。目前被广泛采用的机器学习的定义是“利用经验来改善计算机系统自身的性能”。事实上,由于“经验”在计算机系统中主要是以数据的形式存在的,因此机器学习设法要对数据进行分析,从海量的数据中,利用各种机器学习算法,提炼具有洞察价值的信息。
2机器学习核心技术简介
机器学习是人工智能研究发展到一定阶段的必然产物。R.S.Michalski等人把机器学习研究划分成“从例子中学习”、“在问题求解和规划中学习”、“通过观察和发现学习”、“从指令中学习”等范畴。20世纪80年代以来,研究次数最多、应用最广的是“从例子中学习”(即广义的归纳学习),它涵盖了监督学习(如分类、回归)、非监督学习(例如聚类)等众多内容。归纳学习另一个重要分支是神经网络和支持向量机,自从80年代BP“反向传播算法”的发明以来,神经网络得到了极大的发展,现在已经形成“深度学习”这一独立的领域,在图像识别和音频识别方面发挥着重要的作用。以下是主要机器学习核心技术的介绍:
2.1分类算法
分类算法属于监督式学习算法,其原理是通过研究历史数据,提取数据特征指标,依据历史数据结果,形成分类规则集合,通过信息熵最大算法,不断对这些规则进行筛选,最终形成对数据进行有效分类的规则集合,以对将来数据进行预测。分类算法包括决策树、随机森林等。
2.2聚类算法
聚类算法属于非监督式学习算法,与分类算法等监督式学习不同,聚类算法不包含数据标签,而是对原始数据特征运用距离算法,以推断出数据标签。常见的聚类算法包括k-Means、分层聚类等。
2.3关联算法
关联算法是从一个数据集中发现数据项直接关联规则的算法,关联算法的代表是基于频繁项集的Apriori算法。如果存在一条关联规则,它的支持度和置信度都大于预先定义好的最小支持度与置信度,我们就称它为强关联规则。强关联规则就可以用来了解项之间的隐藏关系。所以关联分析的主要目的就是寻找强关联规则,而Apriori算法则主要用来帮助寻找强关联规则。
2.4回归算法
回归算法基于统计学的线性回归和逻辑回归分析技术,线性回归是通过“最小二乘法”,对观测数据进行拟合,以对未来数据进行预测;逻辑回归与线性回归算法非常类似,但使用的是离散的数据分类特征,使用sigmoid函数,将线性回归的计算结果转化为0或1的概率,然后根据这个概率进行预测。
2.5支持向量机
支持向量机(SVM)属于基于核的算法,是90年代中期发展起来的基于统计学习理论的一种机器学习方法,通过寻求结构化风险最小来提高学习机泛化能力,实现经验风险和置信范围的最小化,从而达到在统计样本量较少的情况下,亦能获得良好统计规律的目的。
2.6神经网络
人工神经网络算法模拟生物神经网络,是一类模式匹配算法。通常用于解决分类和回归问题。人工神经网络是机器学习的一个庞大的分支,有几百种不同的算法,重要的人工神经网络算法包括:感知器神经网络(Perceptron Neural Network),反向传递(Back Propagation),学习矢量量化(Learning Vector Quantization,LVQ)等。
以上是对机器学习核心技术和算法的简要介绍,实际上机器学习领域发展很快,各种算法层出不穷。据统计,现有的机器学习算法已经超过1000种。我们这里主要介绍一些应用比较广泛的机器学习技术,为后续在高中阶段学生自主学习中应用做铺垫。
3基于机器学习的自主学习
高中阶段学生要实现自主学习,除了前文提到的机器学习技术已经成熟之外,还有两个先决条件也已经具备。一是随处可得的数据收集和处理技术;另一个是基于互联网的丰富的教学资源和多样的教学手段,包括课件、题库、多媒体课堂等。
3.1大数据技术
大数据技术是随着互联网发展起来的最新数据处理技术,它处理的规模和吞吐量是之前的计算机系统的几百上千倍,因
文档评论(0)