- 1、本文档共42页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计自然语言处理的数学基础 徐志明 哈工大语言技术中心 概率知识 随机试验 相关的概念:样本空间、事件、事件运算 概率 相关的概率类型 联合概率、条件概率 先验概率、后验概率 相关的概率公式 乘法公式、 Bayes公式、全概率公式、事件独立、条件独立 概率分布 随机变量、分布函数、概率函数、概率密度函数 期望、方差、协方差 常见的概率分布 概率估计 随机现象 自然界现象,可分为: 确定性现象: 事物间的联系是确定的,存在着必然的因果关系。在一定条件下,必定会导致某种确定的结果。重复性的实验,结果都一样。 例如:在标准大气压下,水加热到100摄氏度,就必然会沸腾。 不确定现象(随机现象): 事物间的联系是不确定的。在相同条件下,多次进行同一试验,结果是不确定的。 例如:每期体育彩票的中奖号码。投掷硬币。 随机试验 随机试验 一个可观察结果的过程,其结果可能有多个,事先可以知道全部可能出现的结果,但不能确定哪一个结果会发生。 举例: 生孩子:男孩,女孩? 掷硬币:正面,背面? 炒股票:涨,跌,平? 样本空间 样本空间: ? 一个试验的全部可能出现的结果的集合。 其中:每个结果称为一个样本点。 举例: 生两个孩子:? = {男男,男女,女女} 炒股票:? = {涨,跌,平} 事件 事件 一个试验的一些可能结果的集合,是样本空间的一个子集。 每个样本点,也称为一个基本事件。 举例: 一个家庭生两个孩子。? = {男男,男女,女女} 事件A:至少有一个男孩。A= {男男,男女} 事件B:至少有一个女孩。B= {男女,女女} 事件运算 事件运算: 可以采用集合运算法则 ? = {男男,男女,女女} A= {男男,男女}, B= {男女,女女} 事件运算: 积:两个事件同时发生。交集:A∩B = {男女} 和:至少一个事件发生。并集:A∪B = {男男,男女,女女}; 差:A发生,B不发生。差集:A – B = {男男}; 对立:事件A 的对立事件。补集:ā = ? – A = {女女}。 事件概率 概率:P(A) 是一个函数,用于度量事件A发生的可能性大小。 举例:估计一个词的出现概率P(w),或一个句子的出现概率P(S)。 概率函数的三个公理 P(A) ≥ 0; P(?) = 1(概率归一化); P(A∪B) = P(A)+P(B) if A∩B = Φ ; 推论 P(Φ) = 0; A?B ? P(A) P(B) ; P(A∪B) = P(A)+P(B)-P(A∩B ); P(B – A) = P(B) – P(A∩B ); P(ā) = 1 – P(A) 联合概率 两个事件的联合概率 事件A和B同时出现的概率。P (A∩B) ,P(A,B),P(AB) 举例:计算两个词的搭配概率: P(美丽,鲜花) P(股票,投资) N个事件的联合概率: N个事件同时出现的概率:P(A1,A2,…An) 举例:计算一个句子概率: P(我们,是,中国人) P(中国,有,五千年,历史) 条件概率 条件概率:P(A|B) 在事件B发生的条件下,事件A发生的概率。 P(A|B) = P(A,B)/P(B) 举例 注音概率:P(拼音|单词) P(yue4|乐), P(le4|乐) 词性标注:P(词性|单词) P(v|培训), P(n|培训) 词义标注:P(词义|单词) P(了不起|牛), P(动物|牛) 译文选择: P(译文词|原文词) P(数组|array), P(阵列| array) 先验概率与后验概率 先验概率(prior probability) 在没有任何附加条件下的概率值。例如: P(A) 后验概率(posterior probability) 在某种先决条件下的概率值。例如:P(A|B) 乘法公式 事件概率的乘法公式 P(A,B) = P(A) × P(B|A) = P(B) × P(A|B) 把联合概率分解为条件概率的乘积。 推广(chain rule ) P(A1,A2…An) = P(A1)×P(A2|A1)×P(A3|A1,A2) …×P(An|A1,A2…,An-1) 举例: 计算句子概率 P(我们,是,中国人)= P(我们) × P(是|我们) × P(中国人|我们,是) 计算词性序列概率 P(det,adj,n) = P(det)×P(adj|det)×P(n|det,adj) Bayes公式 根据乘法公式 P(A,B) = P(A|B)×P(B) = P(B|A)×P(A) 可推导出Bayes公式 P(A|B) = P(A)×P(B|A)/P(B) 交换事件之间的条件依赖的顺序。 应用:英汉机器翻译 给定一个英语句子E,翻译器寻找一个最好的对应的中文句子C。 全概率公式 划分:设试验E的样本空
您可能关注的文档
- 第一章导论:公共经济学概要.ppt
- 第一章地球知识经纬网.ppt
- 极谱分析新技术.ppt
- 极限存在定理与重要极限.ppt
- 第一章第二章公共关系学基本概述.ppt
- 《CorelDRAWX3教程》07.ppt
- 《2010年高考语文二轮复习作文导写》课件.ppt
- 《CorelDRAWX3教程》10.ppt
- 第一章第七节重要极限.ppt
- 急救LiftingandMovingPatients.ppt
- 2025秋 名师金典高考总复习 语文课件03 板块一 考题研析 任务突破一 第2讲 观点评价与推断题.pptx
- 2025秋 名师金典高考总复习 语文课件06 板块一 考题研析 任务突破二 第2讲 观点印证与迁移运用题.pptx
- 生物化学第四版教学课件完整版.ppt
- 新目标大学英语系列教材:西方文化英语教程 Unit 9 PPTx修订版.pptx
- 星期二下午english ab initio paper 2 sl英语.pdf
- 软件excel考试使用说明.pdf
- 参考分析project项目.pdf
- sigma-p8650共aldrich安全数据表.pdf
- 详细设计重定向.pdf
- 放松技术中心.pdf
文档评论(0)