《特征工程入门与实践》读书笔记.pptxVIP

  • 2
  • 0
  • 约1.89千字
  • 约 23页
  • 2023-07-17 发布于广东
  • 举报
思维导图PPT模板《特征工程入门与实践》最新版读书笔记,下载可以直接修改 01第1章 特征工程简介第3章 特征增强:清洗数据第5章 特征选择:对坏属性说不第2章 特征理解:我的数据集里有什么第4章 特征构建:我能生成新特征吗第6章 特征转换:数学显神通目录0305020406 07第7章 特征学习:以AI促AI内容简介第8章 案例分析目录0908 内容摘要本书将带你了解特征工程的完整过程,使机器学习更加系统、高效。你会从理解数据开始学习,机器学习模型的成功正是取决于如何利用不同类型的特征,例如连续特征、分类特征等。你将了解何时纳入一项特征、何时忽略一项特征,以及其中的原因。你还会学习如何将问题陈述转换为有用的新特征,如何提供由商业需求和数学见解驱动的特征,以及如何在自己的机器上进行机器学习,从而自动学习数据中的特征。 第1章 特征工程简介特征工程(feature engineering)是这样一个过程:将数据转换为能更好地表示潜在问题的特征,从而提高机器学习性能。 1.1 激动人心的例子:AI驱动的聊天1.2 特征工程的重要性1.3 特征工程是什么1.4 机器学习算法和特征工程的评估1.5 特征理解:我的数据集里有什么1.6 特征增强:清洗数据010302040506第1章 特征工程简介 1.7 特征选择:对坏属性说不1.8 特征构建:能生成新特征吗1.9 特征转换:数学显神通1.10 特征学习:以AI促AI1.11 小结12345第1章 特征工程简介 第2章 特征理解:我的数据集里有什么 特征和属性通常有明显的区分。 2.1 数据结构的有无2.2 定量数据和定性数据2.3 数据的4个等级2.4 数据等级总结2.5 小结12345第2章 特征理解:我的数据集里有什么 第3章 特征增强:清洗数据属性一般是表格数据的列,特征则一般只指代对机器学习算法有益的属性。 3.1 识别数据中的缺失值3.2 处理数据集中的缺失值3.3 标准化和归一化3.4 小结第3章 特征增强:清洗数据 第4章 特征构建:我能生成新特征吗 通常会利用轮廓系数(silhouette coefficient,这是一个表示聚类分离性的变量,在-1和1之间)加上一些人工分析来确定特征工程是提升了性能还是在浪费时间。 4.1 检查数据集4.2 填充分类特征4.3 编码分类变量4.4 扩展数值特征4.5 针对文本的特征构建4.6 小结010302040506第4章 特征构建:我能生成新特征吗 第5章 特征选择:对坏属性说不 一般而言,可以将监督学习分为两种更具体的类型:分类(预测定性响应)和回归(预测定量响应)。 5.1 在特征工程中实现更好的性能5.2 创建基准机器学习流水线5.3 特征选择的类型5.4 选用正确的特征选择方法5.5 小结12345第5章 特征选择:对坏属性说不 第6章 特征转换:数学显神通 在监督学习中,我们一般将数据集中希望预测的属性(一般只有一个,但也不尽然)叫作响应(response),其余属性叫作特征(feature)。 6.1 维度缩减:特征转换、特征选择与特...6.2 主成分分析6.3 线性判别分析6.4 LDA与PCA:使用鸢尾花数据集6.5 小结12345第6章 特征转换:数学显神通 第7章 特征学习:以AI促AI 特征是对机器学习过程有意义的数据属性。 7.1 数据的参数假设7.2 受限玻尔兹曼机7.3 伯努利受限玻尔兹曼机7.4 在机器学习流水线中应用RBM7.5 学习文本特征:词向量7.6 小结010302040506第7章 特征学习:以AI促AI 第8章 案例分析我们经常需要查看表格,确定哪些列是特征,哪些只是普通的属性。 8.1 案例1:面部识别8.3 小结8.2 案例2:预测酒店评论数据的主题第8章 案例分析 内容简介 数据的4个等级是:? 定类等级(nominal level)? 定序等级(ordinal level)? 定距等级(interval level)? 定比等级(ratio level) (1) 在应用任何特征工程之前,得到机器学习模型的基准性能; (2) 应用一种或多种特征工程; (3) 对于每种特征工程,获取一个性能指标,并与基准性能进行对比; (4) 如果性能的增量(变化)大于某个阈值(一般由我们定义),则认为这种特征工程是有益的,并在机器学习流水线上应用; (5) 性能的改变一般以百分比计算(如果基准性能从40%的准确率提升到76%的准确率,那么改变是90%)。 谢谢观看

文档评论(0)

1亿VIP精品文档

相关文档