- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第?一部分:逻辑(logic)
1-1、概述
逻辑是?人对于知识的定义和解释,主要分为两种
命题逻辑(propositional logic):?比较基础,适?用于?一些?人?工智能问题
?一阶逻辑(first order logic):更有表达能?力,在?人?工智能领域使?用较为??广泛
1-2、命题逻辑(propositional logic)
1-2-1、组成
逻辑常量:真值,假值
命题符号:表?示原?子命题,语义由使?用者定义
括号
连接符:析取(∧),合取(∨),蕴含( ),等值( ),?非( )
1-2-2、真值表(truth table)
真值表?用来说明命题中的原?子命题为真值或假值的情况下命题的真假
当命题中的原?子命题的真值确定时命题的真值也随之确定
1-2-3、模型与知识库(model and knowledge base)
知识库:多个命题的集合
模型:使得知识库中全部命题都为真时的原?子命题真值组合
1-2-4、恒真命题,?矛盾与导出(tautology, contradiction and entail)
恒真命题:不论命题中的原?子命题的真值,命题都为真
?矛盾:不论命题中的原?子命题的真值,命题都为假
P导出Q(记为P |= Q):当命题P为真时,命题Q也为真
此时命题P的模型也是命题Q的模型
1-2-5、优缺点
优点:命题的真假与上下?文?无关
缺点:表达能?力有限
1-3、?一阶谓词逻辑(first-order predicate logic)
1-3-1、组成
对象:表?示?一个具体对象
谓词符号:表?示对象的属性
量词:全称量词( ),存在量词( )
1-3-2、谓词逻辑的作?用域
1、如果量词后?面有括号就作?用在括号范围内
2、如果量词后?面没有括号就负责到连接符之前
3、如果量词后?面还是量词就作?用到后?面那个量词的作?用域
1-3-3、命题证明
?一般通过转换成对应?比较好证明的等价命题进?行证明
第?二部分:数学基础(foundation of mathematics)
2-1、概率论基础(probability)
乘法定律:
加法定律:
2-2、期望,中位数,众数与?方差(expectation, median, mode and variance)
2-2-1、期望
离散型变量的期望:
连续型变量的期望:
期望的性质:
2-2-2、?几何平均数(geometric mean)
2-2-3、中位数
当X(1..n)为有序时,在n为奇数的情况下:
在n为偶数的情况下:
2-2-4、众数
2-2-5、?方差
2-2-6、协?方差(covariance),协?方差矩阵与相关系数(correlation coefficient)
假设多变量 下的m组数据
协?方差矩阵为:
注:对于样本数据集来说要除的是m - 1,?而不是m
变量Cj和Ck的相关系数为:
注:相关系数只对于两个变量?而?言
例题?一:假设数据样本
其协?方差矩阵为
相关系数为
2-3、数据质量及数据类型
2-3-1、数据质量
精度:数据的聚合程度,?一般通过标准差进?行衡量
偏移量:通过与均值进?行?比较
2-3-2、随机变量类型
离散型随机变量:
伯努利随机变量
泊松随机变量
连续型随机变量:
均匀分布随机变量
正态分布随机变量
2-3-3、数据类型
标定数据(nominal data):仅具有名称上的含义,没有数学上的含义
有序数据(ordinal data):具有顺序含义的数据
区间数据(interval data):某个区间段的数据
?比例数据(ratio data):连续型数据
2-4、距离
Minkowski距离
city-block距离
Euclidean距离
Supermum距离
2-5、熵(entropy)
信息熵(单位:bit)
联合熵与条件熵(单位:bit)
第三部分:分类(classification)
3-1、概述
传统分类主要分成两步:
1、训练:将已知类别标签的数据作为训练集对模型(分类器)进?行训练
2、测试:将未知标签的数据作为测试集测试模型(分类器)的准确度
衡量指标:准确性,速度,鲁棒性,可扩展性,可解释性
3-2、决策树(decision tree)
3-2-1、概述
特征:树状结构,内部节点表?示基于某个属性的分裂,分?支表?示不同的属性,叶节点表?示最终的
数据分布
训练过程:初始化所有数据分布在?一个节点(根节点)上,然后这个根节点通过选择属性进?行分
裂。直到没有多余的可以分裂的属性或每个叶节点的样本都是?一个类别的。
测试过程:去掉
您可能关注的文档
最近下载
- 化工生产技术项目苯乙烯的生产.ppt VIP
- 九年级上册历史总复习知识点(可打印).pdf VIP
- 《红星照耀中国》第九章:同红军在一起(续)+带读课(课件)语文统编版2024八年级上册.pptx VIP
- 推拿治疗学不寐课件,十四五推拿治疗学课件.pptx VIP
- 《道德与法治》课程标准测试题含参考答案.pdf VIP
- 酒吧劳动用工合同范本7篇.docx VIP
- 是否应该禁止使用塑料袋和塑料吸管?辩论赛 正方辩词一辩、二辩、三辩、四辩发言稿.docx VIP
- 21年浙江6月卷高考地理真题解析.pptx VIP
- 药店动态质量管理知识(一)答案-2025年执业药师继续教育.docx VIP
- 【中学】【育人故事】唤醒你的“耳朵”.docx VIP
文档评论(0)