- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
最大熵与对数线性模型用于分类问题讲课要点
最大熵与对数线性模型(用于分类问题)讲课要点
李正华
2015 年 12 月 6 日
目录
1 从最大熵原理(maximum entropy)到对数线性的形式(log-linear) 1
1.1 符号定义 . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 最大熵 . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 求解最大熵模型 . . . . . . . . . . . . . . . . . . . . . . . 3
2 Log-linear model 的似然函数及梯度 6
3 以词性标注为例,实现一个最大熵模型 6
3.1 Stochastic Gradient Descent (SGD) 训练,basic 版本 . . . 6
4 编程作业 6
5 SGD 训练,L2 regularization 7
6 模拟退火 7
7 一段真实的 C++ 程序,同时使用 L2 regularization 和模拟退火,供参考 7
8 Adwait Ratnaparkhi: A Simple Introduction to Maximum Entropy
Models for Natural Language Processing (1997) 8
1 从最大熵原理(maximum entropy)到对数线性的形式(log-
linear)
主要参考/afs/cs/user/aberger/www/html/tutorial/tutorial.html,
建议看到 outline 小节即可。同时也阅读了李航老师的《机器学习方法》相关部分。
我觉得这两个参考文献,在用拉格朗日乘子求解时,都有一些小的瑕疵。所以再写
一遍(还有个问题没有完全理解)。
1.1 符号定义
:表示一个数据集,包含 个实例 和对应的 个人工标注
类别标记 。
:表示类别集合, 。
1
Count :表示实例 在数据集 出现的概率,满足 ∑
Count :表示实例 及对应答案 在数据集 出现的概率,满足
∑
和 一般称为经验概率,即从数据中通过数数直接可以得到的概率。这
两个概率符号的引入,主要是为了简化下面的推导。
1.2 最大熵
在数据集 上,对一个模型(概率分布) 的熵的定义为:
∑ ∑
您可能关注的文档
- 无障碍网页的优先等级.PPT
- 既有钢筋混凝土Π梁正截面抗弯承载力研究-中南大学学报.PDF
- 腹地整合——建立泛珠三角经济区-综合开发研究院.PDF
- 日文阅读指导-辅仁大学学术资源网.DOC
- 无芯马达无刷马达的技术情报-NamikiPrecisionSingaporePteLtd.PDF
- 日本留学生汉语声调习得的偏误类型-西安培华学院.DOC
- 日本的公害对策基本法-法学研究.PDF
- 日本商品化权的历史演变与理论探析-中国法学网.PDF
- 脑瘫的发育神经学异常.PPT
- 日本的现代水-法学研究.PDF
- 2024年度安永全球另类投资基金调查报告.docx
- 2024年中国汽车产业出海回顾分析 -中汽信科国际化研究团队.docx
- 【民航局国际合作服务中心】马尔代夫民航业发展研究报告.docx
- 2025走向融合与深化的中国媒介市场报告-星传媒体.docx
- 2023Givaudan和ESG目的与性能.docx
- 中国民间应对气候变化行动故事集-教育故事.docx
- 2025AI制药市场规模产业链构成应用现状及AI制药公司分析报告.docx
- 医疗器械专题之基因测序:分子诊断掌上明珠,四代测序开启规模化应用时代.docx
- 2024年中央银行黄金储备调查报告 202406.docx
- 智慧芽 -2024第4季度全球潜力靶点及FIC产品调研报告.docx
文档评论(0)