- 0
- 0
- 约6.08千字
- 约 6页
- 2025-10-23 发布于山东
- 举报
为天地立心,为生民立命,为往圣继绝学,为万世开太平。——张载
AI基础知识介绍
机器学习主要价值就是学习一个经验E,根据这个学习到的经验E去执行
一个任务T,目标是优化执行任务T的表现P。
比如:在银行,根据数据,AI学习客户表现和客户信用之间的关系,这个
关系是经验E;然后为每个客户实时计算更准确的信用卡额度,这个是任务T;
目标P是在一定风险承担范围内,增加银行信用卡收入。
1机器学习的基础流程
请大家明晰,这七步是在干什么,以什么逻辑和时间轴。后续的介绍将聚
焦在其中一两个步骤。但我们经常混淆,比如混淆AI训练和AI执行任务。
1.选择算法。比如,刚才银行的例子,我们先要对客户进行分类找到黑名
单,这是分类算法,也要通过客户行为预测他的额度水平,这是回归算法。前
篇对于Transformer的讨论,就是一个最新的高级一些的算法。
2.准备高质量的数据,并进行特征工程。通常这些要花费很多时间,特别
是工业界,往往没有高质量的数据。这里数据质量有四个层面:一是绝对的数
据量,这个好理解。二是样本数据,比如,在银行风控领域,如果只是交易数
据,那不是样本,必须有真正的欺诈数据;比如,在设备管理领域,不但要有
设备的运行数据,还要有设备的故障数据,这样机器才可以真正学习。三是数
据的处理效率,对于AI真正有价值的往往是实时数据,这是发挥AI决策最大
价值的关键。四是特征工程,只有数据是不够的,要进行处理,拿出机器可以
理解而且有价值的特征才是根本。最简单的例子就是男、女要分别改成0或
1。特征工程是AI计算最重要的领域,整个深度学习的神经网络可以理解为就
是在做数据的特征工程。
3.对数据用算法进行训练。这个训练的过程才是让机器有能力执行任务的
关键步骤,而且很多计算算法的逻辑也针对的这部分。我们讲算力是决定性因
素,也往往指训练阶段的算力瓶颈。
4.训练结束一般还要做很多测试,确保这个经验是能够应对多种情况,从
而真正形成经验E。
5.经验E要用到生产系统,实时地执行任务T。比如,上面例子中,我们核
先天下之忧而忧,后天下之乐而乐。——范仲淹
心任务是对每个用户的信用额度动态调整。
6.评估执行表现。AI的表现相对于人工会提升多少,和计划是否有偏差
等。
7.持续优化。这里的优化是全方位的,既要更新算法,提高数据质量,又
要有更拟合的训练结果及更实时地执行任务等。经常听客户说,AI可能在我们
这里落地效果不好。其实AI在哪里落地,刚开始时效果都不会好,真正让AI
起作用,是需要持续优化。第四范式的很多AI驱动的客户,也把这一条当做自
己重要的核心竞争力,即持续迭代的能力。
2机器学习的理论基础
我们先从这个经验E如何训练出来谈起。
假设,这个经验E可以抽象成一个线性关系(当然现实世界不一定是简单
的线性关系,这里只是简单化处理),即设Y=f(x)=wx+b,x是银行数据(比如:
还款逾期率),Y是信用额度。我们要学习的经验E,就是学习这个f(),这个概
念很重要,建议停下来稍加理解。
要想得到f(),需要先拿一些样本(也就是我们事先知道一些x数据,以及
对应的y)进行训练。
例如:
信用额度还款逾期率
100000
您可能关注的文档
最近下载
- 2009斯巴鲁森林人维修手册wi 19911c.pdf VIP
- 水煤浆加压气化法生产合成氨及尿素生产线项目可行性研究报告(1).docx VIP
- 数据中心气流组织技术规范(T/2019) 2019 33页.pdf VIP
- 3.1 《百合花》小说情节的梳理及作用(课件)高一语文对接高考之教材中的考点(统编版必修上册).pptx VIP
- 深度解析(2026)《GBT 19294-2003航空摄影技术设计规范》.pptx VIP
- 旅游北京胡同英语作文.docx VIP
- 2025年一例慢性肾衰患者疑难病例讨论(干货分享).pptx
- 2017年刑法新规定224条.doc VIP
- 2024届高考物理三轮冲刺知识清单:高考物理涉及到的实验讲解总结.docx VIP
- 2025年春新统编版道德与法治七年级下册全册教学课件.pptx
原创力文档

文档评论(0)