- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ISSN 1000—0054 清华大学学报 (自然科学版)2011年 第 51卷 第 11期 13/27
JTsinghuaUniv(Sci&Tech),2011,Vo1.51,No.11 1686—169O
基于 Markov逻辑网的句子压缩方法
金 锋 , 黄民烈, 朱小燕
(清华大学 计算机科学与技术系,北京 100084)
摘 要 :提出了一种基于Markov逻辑网通过删除单词进行 可行的办法_2]。另外 ,句子压缩技术也可以用于视
英文句子压缩的方法。通过一阶逻辑公式表示单词的局部 频节 目的字幕生成 ,以及为移动设备生成简洁的文
特征以及单词之间的相互依赖关系,确定单词是否应该删 本_3 等许多领域 。
除。与现有方法相 比,该方法把判别式学习和整数规划的优
目前的相关研究提出的大多数方法都是通过删
点相结合,既融合 了丰富的句子特征,又以逻辑公式方便地
除不重要的单词或者短语来进行句子压缩的,这些
表示全局约束。在书面和 口语两个新闻数据集上的实验结
方法既包括有监督学习算法 ,也包括一些无监督方
果表明:该方法与L3和 sVTL系统相比具有明显优势,在
法 。Knight和 Marcul2用噪声信道模型来对句子
压缩率接近时,以人工压缩结果为评测标准 ,压缩后句子 的
依存关系F-score有较大提高。 压缩进行建模 ,同时提 出了一种基于决策树学习的
压缩算法 。McDonaldl5利用 了丰富的特征,包括单
关键词:句子压缩;文档摘要;Markov逻辑网
词、词性 、句法和短语结构特征 ,同时结合最大边 际
中图分类号:TP391.1 文献标志码 :A
学习算法进行句子压缩 。还有一些相关研究中用到
文章编 号 :1000—0054(2011)11-1686—05
了条件随机场 ]和支持 向量 回归等有监督学 习算
法 j。无监督方法主要包括那些基于整数规划 的压
缩方法 。句子中的单词通常不是孤立的个体 ,而是
相互依赖的,单词 的删除和保留是一个全局性 的问
题 。为了对这种全局依赖关系进行建模 ,一些研究
人员引入 了整数线性规划 [3],并且把依赖关系表
示成规划的约束条件。有监督方法的优点在于可以
方便地融合丰富的特征 ,但是 由于计算效率等原 因,
往往难以处理全局依赖关系。而无监督 的基于整数
规划的方法虽然可 以处理全局依赖关系,却难 以融
合较多的特征 。
文档评论(0)