- 10
- 0
- 约1.6万字
- 约 17页
- 2018-10-03 发布于安徽
- 举报
1、有监督学习和无监督学习的区别
有监督学习:对具有标记的训练样本进行学习,以尽可能对训练样本集外的数据进行分类预测。(LR,SVM,BP,RF,GBDT)
无监督学习:对未标记的样本进行训练学习,比发现这些样本中的结构知识。(KMeans,DL)
2、正则化
正则化是针对过拟合而提出的,以为在求解模型最优的是一般优化最小的经验风险,现在在该经验风险上加入模型复杂度这一项(正则化项是模型参数向量的范数),并使用一个rate比率来权衡模型复杂度与以往经验风险的权重,如果模型复杂度越高,结构化的经验风险会越大,现在的目标就变为了结构经验风险的最优化,可以防止模型训练过度复杂,有效的降低过拟合的风险。
奥卡姆剃刀原理,能够很好的解释已知数据并且十分简单才是最好的模型。
过拟合
如果一味的去提高训练数据的预测能力,所选模型的复杂度往往会很高,这种现象称为过拟合。所表现的就是模型训练时候的误差很小,但在测试的时候误差很大。
产生的原因过拟合原因:
样本数据的问题。
样本数量太少;
抽样方法错误,抽出的样本数据不能有效足够代表业务逻辑或业务场景。比如样本符合正态分布,却按均分分布抽样,或者样本数据不能代表整体数据的分布;
样本里的噪音数据干扰过大
2. 模型问题
模型复杂度高 、参数太多
决策树模型没有剪枝
权值学习迭代次数足够多(Overtraining),拟合了训练数据中的噪声和训练样
您可能关注的文档
- 2018一建公路的工程实务亲手笔记总结必考点.doc
- 2019届高考政治一轮复习练案20第四单元当代国际社会第9课维护世界和平促进共同发展新人版必修2.doc
- 2019年高考物理大一轮复习微专题04“传送带模型”和“滑块_木板模型”问题学案新人版.doc
- 2019年高考物理大一轮复习微专题08动力学动量和能量观点在力学中的应用学案新人版.doc
- C20砼路面质量评定表.doc
- C30水泥混凝土路面施工设计方案.doc
- GB50345-2004屋面工程技术规范设计.doc
- GBZ188-2014职业健康监护技术规范设计信息.doc
- HF240_90中文说明书.doc
- GB50333-2013医院的洁净手术部建筑技术规范设计解读.doc
- 河北省市场监督管理系统行政裁量权基准- 行政强制.pdf
- TJSP-再生原料生产的二乙二醇丁醚乙酸酯.pdf
- 外卖送餐食品安全管理规范编制说明.pdf
- DB44T2828-2026 城镇燃气安全检查与评估标准.pdf
- 河北省市场监督管理系统行政裁量权基准- 质量发展与安全监督管理.pdf
- TZJGFTR002-2021 再生退锡液产品标准.pdf
- TCGFA-绿色食品 鄂西湘西宽皮柑橘生产操作规程编制说明.pdf
- DB11T1031-2025 低层蒸压加气混凝土承重建筑技术规程.pdf
- TCASME-绿色建造工程施工现场环境管理规程编制说明.pdf
- TCASME-建筑工程管理 建筑机械安全使用技术规范编制说明.pdf
最近下载
- 2024民用建筑工程总平面初步设计、施工图设计深度图样24J804.pdf VIP
- 五氧化二钒提质升级改造项目环评环境影响报告书.pdf
- 2025年夏季世界少年奥林匹克数学竞赛省级选拔赛一年级数学试题+答案.pdf
- 轻钢结构房屋建设合同6篇.docx
- 水利工程施工组织设计精选.doc VIP
- 伊顿UPS电源彩页汇总(伊顿UPS、伊顿机柜、伊顿PDU、伊顿STS、伊顿机房空调).pdf VIP
- 模拟商务谈判情景剧(修改本).doc VIP
- 2023年郑州科技学院计算机科学与技术专业《计算机组成原理》科目期末试卷A(有答案).docx VIP
- 2025年自贡市中考语文试卷(含答案及解析).docx
- JC_T 2777-2023 公路工程用泡沫混凝土.pdf VIP
原创力文档

文档评论(0)