- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算语言学工作者需要了解的数学知识
常宝宝
北京大学计算语言学研究所,100871
chbb@
计算语言学是一门交叉学科,其中不仅涉及到语言学、计算机科学,还大量应用到
数学知识。尤其是近年来,随着语料库语言学的兴起,统计等数学方法和技术在计算语
言学中更是得到了越来越广泛的应用。
第一节 概率统计基础①
一 事件和概率
定义 1. 随机事件: 在一定条件下,可能发生也可能不发生的试验结果称为随机事件,简
称事件,一般用大写拉丁字母A ,B,C,…表示。
随机事件有两个特殊情况,即必然事件(在一定条件下,每次试验都必定发生的事
件)和不可能事件(在一定条件下,每次试验都一定不发生的事件) ,分别记为Ω和Φ 。
随机事件在一次试验中是否发生,固然是无法肯定的偶然现象,但当进行多次重复
试验,就可以发现其发生的可能性大小的统计规律性。具体说,如果在相同条件下进行
v
了n 次重复试验,事件A 出现了v 次,那么事件A 在 n 次实验中出现的频率为是 。当
n
n 无限增大时呈现稳定性。这一统计规律性表明事件发生的可能性大小是事件本身所固
有的、不以人们主观意志而改变的一种客观属性。
事件之间的关系和运算
(1) 包含 当事件B 发生时,如果事件A 也一定发生,则称A 包含 B 或A 包含于 B 中,
记作A⊃B 或 B⊂A 。
(2) 等价 如果A⊃B 且 B⊃A ,即事件A 和 B 同时发生或不发生,则称A 和 B 等价,记作
A=B 。
(3) 积 表示事件 A 和 B 同时发生的事件,称为A 与 B 的积,记作A ∩B 或AB 。
(4) 和 表示事件 A 或事件 B 发生的事件,称为A 与 B 的和,记作A ∪B 或A+B 。
(5) 差 表示事件 A 发生而事件 B 不发生的事件,称为A 与B 的差,记作A -B 。
(6) 互斥 如果事件A 与B 不可能同时发生,即AB=Φ ,则称A 与 B 是互斥的。
(7) 对立 如果事件 A 与 B 互斥,又在每次试验中不是出现 A 就是出现 B ,即 AB=Φ且
A+B=Ω,则称B 为A 的对立事件,记作B= A 。
定义 2. 概率:事件A 发生的可能性大小称为事件的概率,记作 P(A) 。
① 若读者对概率统计方面的基本概念已经熟知,可以越过本节直接阅读下一节
当试验的次数 n 足够大,可以用事件的频率近似地表示该事件的概率,即
v
P (A) ≈
n
概率的基本性质:
(1) 0 ≤P(A) ≤1。
(2) P(Ω)=P(必然事件)=1 。
(3) P(Φ)=P(不可能事件)=0 。
(4) P(A+B)=P(A)+P(B)-P(AB) 。若A ,B 互斥,则 P(A+B)=P(A)+P(B) ,若A ,A ,…,A 两两
1 2
文档评论(0)