- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
;创新与贡献;创新与贡献;机器学习的发展可以追溯到1950年。其发展过程大体经历了3个重要时期,即推理期、知识期和学习期。
1970年前称为推理期,主要标志是让机器具有简单的逻辑推理能力。
1970年后称为知识期,主要标志是1965年E.A.Feigenbaum等人研制了世界上首个专家系统。?
80年代至今称为学习期,主要标志是让机器从样本中学习。;深度学习是机器学习和人工智能的一个重要组成部分,来源于人工神经网络研究和发展。最早是由加拿大多伦多大学计算机系的教授GeoffreyE.Hinton于2006年提出,Hinton通过pre-training较好地解决了多层网络难以训练的问题。深度学习近年来在图像识别和语音识别上取得了突破性的进展,深度学习的成功主要归功于三大因素,即大数据、大模型和大算力,深度学习的优越性能将人工智能推向了新的高潮。;创新与贡献;创新与贡献;创新与贡献;创新与贡献;1准确率(Accuracy);创新与贡献;创新与贡献;交叉验证的基本思想:将数据分成训练集和测试集。在训练集上训练模型,然后利用测试集模拟实际的数据,对训练模型进行调整或评价,最后选择在验证数据上表现最好的模型。
交叉验证法的优点是可以在一定程度上减小过拟合,还可以从有限的数据中获取尽可能多的有效信息。常用的交叉验证的方法有:
(1)K折交叉验证
(2)留一交叉验证(LeaveOneOutCrossValidation);创新与贡献;创新与贡献;通常情况下,解决过拟合问题的方法有两种:
(1)利用正则化来控制模型的复杂度,改善或减少过度拟合的问题。
(2)根据实际问题增加足够的训练数据。
欠拟合是模型在训练和预测时,其准确率都较低的现象。产生的原因可能是模型过于简单,没有充分的拟合所有的数据。解决欠拟合问题的方法是优化和改进模型,或采用其它的机器学习算法。;创新与贡献;创新与贡献;创新与贡献;创新与贡献;创新与贡献;创新与贡献;创新与贡献;创新与贡献;创新与贡献;创新与贡献;创新与贡献;创新与贡献;创新与贡献;相较于传统数据,人们将大数据的特征总结成4V,即数据量大(Volume)、多样性(Variety)、价值密度低(Value)和高速度(Velocity)。大数据的主要难点并不在???数据量大,因为通过对计算机系统的扩展可以在一定程度上缓解数据量大带来的挑战。大数据真正难点来自于数据多样性和高速度。数据类型多样使得系统不仅要处理结构化数据,还要处理文本、视频等非结构化数据。在金融分析、航空航天等行业,数据处理速度要求非常高,时间就是效益。传统的数据处理算法无法满足快速响应的需求,因此迫切需要新型算法的支持。为了应对大数据面临的挑战,以Google为代表的互联网企业近几年推出了各种不同类型的大数据处理系统,推进了深度学习、知识计算、可视化等技术在大数据背景下的发展。;创新与贡献;创新与贡献;创新与贡献;创新与贡献;创新与贡献;创新与贡献;创新与贡献
文档评论(0)