- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向语言处理的大规模结构化学习理论和技术-语言计算与机器学习
面向语言处理的大规模结构化学习理论和技术
马树铭 任宣丞 孙栩
北京大学计算语言学教育部重点实验室,北京 100871
{shumingma, renxc, xusun}@pku.edu.cn
摘要 大规模结构化学习是语言处理中的一个重要问题。本文介绍了近年来针对大规模结构
化学习的关键理论和重点技术。重要的传统模型有条件随机场,结构化感知器和概率化感知
器,这些模型在速度和效果上各有优势。为了减少传统模型在大规模学习中的标注工作,隐
变量模型被应用于大规模结构化学习中,用隐变量来代替精确的标注数据。近来,神经网络
模型的广泛应用又减少了特征提取工作,进一步提高了大规模结构化学习的效果。最后,正
则化模型,特别是结构正则化方法,可以大大降低模型过拟合的风险。
1 引言
语言处理(Language Processing)是人工智能领域的重要组成部分。作为人机接口的核
心技术之一,语言处理包括两个方面:语言理解和语言生成,前者为输入、后者为输出,两
者协同作用于人与计算机的沟通,其意义不言而喻。
结构化学习,是语言处理的重要解决手段之一。语言本身有着丰富而复杂的结构,划分、
界定这些线性序列中隐含的结构长久一来都是语言学家研究分析的重点。如果语言处理任务
能够清晰、准确地识别语言中的各种结构,比如短语结构、依存关系、语义角色关系等,对
基于语言结构的理解和生成大有裨益。
然而,语言的复杂性和多样性,大大增加了结构化学习的难度。为了适应语言的这一特
点,使用大规模语料、运用大规模模型成为目前语言处理增强能力、提升效果难以跨越的关
卡。
大规模的结构化学习,在实践中确实带来了效果的明显提升,然而其过慢的学习速度,
一定程度上制约了其在实际中的应用。大规模结构化学习目前的关涉主要有两点:一是提高
学习速度,让使用更大规模数据、模型成为可能;二是,在可以接受的范围内尽量维持原有
的效果提升。
经过近几年的发展,大规模结构化学习形成了一套较为完整的理论、涌现出一批得到实
际应用验证的技术。本文试图对现有的成果进行梳理,针对不同类别的模型以及大规模学习
带来的过拟合问题介绍现有的解决方案 。
2 传统模型解决结构化问题
2.1 条件随机场
在传统的语言处理中 Lafferty et al.[1]提出的条件随机场 (Conditional Random Fields,
CRFs)模型占有重要地位,作为全局化的概率模型,其核心是最大化给定输入下正确输出的
条件概率:
1
( | )
, = exp(∑ (,))
(,)
( )
, =∑exp(∑ (′,))
′
其中 x 为输入序列、y 为输出序列、y’为所有可能输出序列、θ为模型参数(特征权重)、f
为特征模板势函数,Z 为归一化函数。
CRF 的学习方法一般是基于梯度的最大似然学习。由于 CRF 每次预测的是一个全局结
构,而不是一个局部的标签;因而在预测的时候需要从输入根据模型参数搜索最优结构,该
过程被称为解码过程,往往采用基于动态规划的维特比算法(Viterbi Algorithm),以避免枚
举遍历的极高复杂度。
2.2 结构化感知器
尽管如此, CRF 的训练效率依然较低。 Collins[2]提出的结构化感知器 (Structured
Perceptron)算法 (图1),在一定程度上解决 CRF 的训练速度问题 ;并在理论上保证,如果
数据可分,该算法是收敛的。这一算法避免了 CRF 中的梯度计算,仅针对预测错误的
您可能关注的文档
- 南京工业大学拟推荐2017年江苏科学技术奖项目.doc
- 南海珍珠贝肉的营养成分分析与评价-水产学报.pdf
- 南韩企业no1的三个秘密.ppt
- 南昌大学建筑工程学院结构试验室设备采购项目-南昌公共资源交易中心.pdf
- 耐铜植物茵陈蒿根际细菌群落结构及影响因素-生态学报.pdf
- 南澳渔民转产转业科研培训基地填海工程-福建环境科学研究院.doc
- 南半球夏季12南极涛动指数重建及其变率分析-龚道溢-减灾与.doc
- 奶牛胎次对乳中犆犔犃含量和9去饱和酶指数的影响-畜牧兽医学报.pdf
- 奶牛tmr精准饲喂和持续改进技术.pdf
- 纳秒级高压脉冲下示波器输入通道保护装置的设计-易迪拓培训.pdf
- 面向配电网通信的光载无线系统线性度的研究-电力系统保护与控制.pdf
- 面向时序逻辑的门级信息流分析方法-自然科学版.pdf
- 面向模拟驾驶训练的驾驶意图识别方法-重庆理工大学学报.pdf
- 面向复杂系统虚拟样机协同建模的方法研究-天津大学研究生e-learning平台.pdf
- 面向行政区的总氮污染源解析-水资源与水工程学报.pdf
- 面向复合故障的牵引逆变器四桥臂容错控制-电源学报.pdf
- 面向高端容错计算机的进程容错系统设计与实现-计算机应用与软件.pdf
- 面向windows平台的深度学习工具使用指引-同济大学软件学院.pdf
- 面上项目指引-物理研究所网上办公系统.doc
- 免疫性坏死性肌病临床特点分析.pdf
最近下载
- 薪酬管理从入门到精通.pdf
- GJB451B-2021装备通用质量特性术语.docx VIP
- 2025昆明滇池国家旅游度假区政务服务局政务服务中心招聘(1人)笔试备考题库及答案解析.docx VIP
- 初中寒假实践总结.docx VIP
- 最新AS9100D:2016全套文件(手册+程序文件+表单共475页).docx VIP
- 客运站年终总结2500字集锦.docx VIP
- ETP48400-C3B1嵌入式电源系统.pdf
- 2025企业安全主体责任清单及对标检查手册.pdf VIP
- 急诊科医疗质量评价体系与考核标准.doc VIP
- TB 10751-2018 高速铁路路基工程施工质量验收标准 含2024年修改单(3-1).pdf
文档评论(0)