- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
自动文摘和文本滤中自然语言智能信息处理技术的研究
摘 要
语言文字是信息的首要载体。人们13常工作中的信息,绝大部分是以语言文字表达、记
载、传播和交换的。因此,随着计算机和因特网的推广应用,由数据处理、信息处理发展到
知识处理,对语言文字处理要求的深度和广度越来越高。目前,网络社会和网络经济正以人
们难以预料的速度在全世界发展,阻碍这种发展的首要瓶颈问题就是自然语言的处理问题。
本文从方法论上较系统的研究和探讨了自然语言处理技术在不同场合的应用。论文内容
分为两大部分,第一部分是关于自然语言理解的方法论。其中详细介绍了基于全信息理论的
自然语言理解方法的基本原理。指出全信息自然语言理解方法的特色是把“基于规则”和“基
于统计”两种方法有机地结合起来,增强对自然语言的理解能力。第二部分是在对全信息自
然语言理解方法论深刻领会的基础上,将理论付诸实践的过程。当前网络信息技术飞速发展,
自动文摘和文本过滤等网络智能业务日益成为人们关注的焦点。而要想真正提高这些智能业
务的智能化程度.就必须借助自然语言处理技术的强有力支持。我们以全信息自然语言理解
的方法论为指导,对自然语言理解技术在这两个领域的应用进行了研究和探索。取得的成果
包括:
(一)采用有效的语义、语用信息表示方法,将机械文摘方法和统计文摘方法有机地纳入
全信息自然语言理解的框架,实现了一个基于机器学习的“近似理解型”的自动文
摘系统。 .
(二)深入研究了自动文摘的评测问题,借鉴机器翻译中的自动评测方法,对文摘进行了
基于内容的评测实验。
(三)提出一种文摘语料库的自动标注方法,通过对文本的意义段划分、句子间的冗余和
指代关系识别,实现了一个行之有效的文摘语料库标注工具。
(四)从语法、语义和语用三个层面对文本内容过滤问题进行了深入地分析,采用统计粗
分和规则细分相结合的方法,在全信息自然语言理解的框架下,实现了网络信息安
全监控目标下的文本过滤和倾向识别。
(五)在文本倾向识别的研究中,运用基于常识的情感推理机制.进行了自然语言深层理
解方面的大胆尝试。
关键词:全信息自然语言理解,自动文摘,文摘评测。文摘语料库,文本过滤,倾向识别
Abstract
themain ofinformation.Inthe
is carrier ofthe
people’S work,most
L锄glmge everyday
is and
information through
expressed,recorded,deliveredexchangedlanguage.Therefore,with
and ofthe and dataand
the Internet,the imformation
applicationcomputers
popularization
have to forthe
developed request
processing knowledgeprocessing,the languageprocessing
is more and and are
society
degreebecomingdeeplywidely.Currently,networkeconomy
文档评论(0)