- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
工程师职称论文发表计算机论文范文赏析.PDF
中国月期刊咨询网
工程师职称论文发表计算机论文范文赏析
计算机现在的应用是非常广泛的,工作娱乐,数据统计等。在学习上,计算机也提供了不少帮助。本文是一篇计算机
类工程师论文发表范文,主要论述了基于统计方法的英语长难句句法分析器研究与实现。
摘要:针对高校学生在英语阅读训练中存在长难句理解障碍等问题,借助自然语言处理技术与UI处理技术,重点研
究一种在线分析与描述英语长难句结构的工具,以帮助高校学生消除理解障碍,促使其提高英语阅读能力。
关键词:统计方法,句法分析器,自然语言处理技术,UI处理技术
作者简介作者简介:孙杰欢(1993-),男,江苏常州人,三江学院计算机科学与工程学院学生,研究方向为数据库及W
4-),男, 江苏盐城人,三江学院计算机科学与工程学院学生,研究方向为数据库及Web开发;姚佳梦(1993-),女,江
苏江阴人,三江学院计算机科学与工程学院学生,研究方向为数据库及Web开发;顾问(1984-),男,江苏无锡人,三
江学院计算机科学与工程学院实验师,研究方向为数据库及Web开发。
0 引言
提高大学生阅读能力是高校英语教学中的重要任务之一。在高校英语阅读训练中, 长句或难句出现的频率很高,学
生语法知识薄弱等问题直接导致其对长难句内部结构的理解模糊不清。针对此问题,笔者借助自然语言处理技术与U
I处理技术,研究了一种在线分析与描述英语长难句结构的工具,以帮助学生消除理解障碍,在使用过程中逐步理解
常见长难句的组成部分,从而促使其提高阅读能力。
1 英语长难句句法分析难点
英语句子由主干和修饰成分两部分组成。主干一般指句子的主要结构,由主谓宾或主系表组成,而修饰成分为单词、
短语、从句3类。其中单词主要是形容词和副词;短语主要是介词短语;从句主要是定语从句和状语从句。在大学英语阅
读训练过程中,为了考查学生的阅读能力,经常会出现复杂的修饰、倒装等方式相互结合使用的长难句,这类句子打
断了学生正常的阅读习惯。较难理解的词句有如下几种:①倒装句。这类句子不同于正常语序,需要重新理解句子成
分,加大了对句子理解的难度;②虚拟语气。通常表示假想,而不表示客观存在的事实,其形式变化多种多样;③比较
级和最高级。比较级和最高级有特殊形式,对单词的不熟悉容易增加句子理解难度;④双重否定。这种句子在形式上
或者语义上用双重否定设置了圈套,干扰了读者的阅读思维,造成了句子理解困难;⑤习惯用语或固定词组。这涉及
到阅读者的知识面,如果阅读者对这些固定组合不熟悉,就很难理解。
笔者研究发现,对于上述①、③、⑤这3类句子,在借助计算机相关技术进行处理后,能够得到较为清晰的分析结果
,从而让高校学生从句子结构方面理解这些长难句。
2 基于统计方法的句法分析器
随着人们对自然语言研究的逐步深入,以及语料库和语料库语言学的兴起,传统基于规则的语言模型受到了质疑,自
然语言处理的主要目标也转为对大规模真实文本的处理,概率和统计驱动的方法几乎成为了自然语言处理的标准方法
[2]。
2.1 统计模型与句法分析器
自然语言处理的核心是构造语言模型,而语言模型就是一种借用数学模型来描述自然语言内在规律的模型。目前,很
多学者都在研究基于统计的语言模型,它通常是概率模型,计算机通过使用统计模型对句子中的单词进行概率分析,
估算出自然语言中语言成分出现的可能性,不像传统的规则型语言模型单纯判断该单词是否符合语言学规则。这种概
率性的语言统计模型在很大程度上比规则语言模型更加客观和全面。
目前,语言统计模型在自然语言处理中已相对成熟,比较典型的有:最大熵语言模型、概率上下文无关语法(PCFG)
、隐马尔可夫模型(HMM)、支持向量机(SVM)、条件随机场(CRF)、基于决策树的语言模型等[2]。
Parser较为杰出并且分析结果比较准确。
中国月期刊咨询网
2.2 OpenNLP Parser
然简单,但有一个致命缺点:这种分类器是自左向右移动窗口标记的,分类器移动到下一个单次前就必须对它前一个
单词作出硬性判断,这样的分类器不能利用后面的单词信息纠正前面的错误判断。
2.3 Stanford Parser
法(PCFG)实现的一个句法分析器。
一个概率上下文无关文法(PCFG)是一个五元组(N,∑,S,R,P):①一个非终结符集N;②一个终结符集∑;③一个开
始非终结符S∈N;④一个产生式集R;⑤对于任意产生式r∈R,其概率为P(r)。
PCFG的规则表示形式为:A→
文档评论(0)