- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
汉语比较句的特征
1 比较关系的挖掘
比较是我们通常的解释方法。提取事物之间的比较关系对于很多应用都具有非常大的价值。例如,我们可以发掘同类产品之间的异同和优劣,以便消费者决定购买意向;可以为决策者们提供以往的相似案例,以便推测当前方案的前景;可以找出人物之间的共同兴趣、爱好、经历,方便人们交友等等。
比较关系的挖掘是一个新颖的任务,目前在这方面的工作较少。Jindal等研究了如何判定英文的比较句,以及从比较句中抽取比较的元素。除直接对句子做分析外,还有从其他角度分析和挖掘事物之间的比较关系。Zhai等通过Cross-Collection Mixture Model挖掘若干文档集之间的共性与差别;Sun、Luo等通过Web搜索来比较两个对象,揭示它们之间的关系;Feldman等从论坛上抽取产品的比较等。
对汉语的比较关系研究主要集中在语言学领域,包括比较的范畴、典型的比较句式、比较的语义以及比较的共时和历时研究等。这些工作对比较关系的挖掘有着指导意义,但并不能直接运用到计算机的自动挖掘上来。国内从计算语言学、Web数据挖掘等领域对汉语比较的研究尚没有开展。
自然语言中的比较句是专门叙述事物间比较的一种句式,识别文本中的比较句是一种挖掘比较关系的手段。本文中,我们尝试使用数据挖掘技术来自动识别汉语比较句。我们分析了汉语比较句的内涵和外延,对一些存在争议的句式作了澄清,并讨论了比较句在词汇和语序上存在的一些特征。我们使用SVM分类器综合这些特征,将汉语句子划分为“比较”和“非比较”两类。我们还讨论了一些影响分类器的因素。实验显示,基于序列模式的分类器和基于词汇特征的分类器相比,尽管在召回率上略有下降,但在准确率上具有明显的优势。同时,通过在分句上抽取短的序列模式,基于序列模式的分类器能够达到最好的效果。
本文如下组织:第2节从自然语言的角度定义汉语比较句,并讨论它的一些特征;第3节叙述自动识别比较句的方法;第4节给出实验和结果;最后是结论和展望。
2 比较中国语言的短语
2.1 关于汉语比较的主要研究文献回顾
比较句在各种语言中广泛存在,对它的研究无论在西方还是东方都是由来已久。Lerner等将比较定义为某个度上的普遍数量,而Stassen认为比较结构是具有在某个谓词量级上赋予两个物体分级位置功能的结构。将汉语中的比较作为一个语法范畴进行研究,从1898年《马氏文通》创建汉语语法系统之初就已经存在,其后又有多人论述,总体思路“基本上都是先从语义概念上划定类别,再将相应的语法形式按语义归类。”
从语义上来说,汉语比较句描述了两个或多个事物在某个属性(维度)上(相同或不同)的位置关系。一个典型的汉语比较句包含四个基本要素:比较主体、比较基准、比较点和比较结果。例如:
中国的国土面积比美国大。
在上述例子中,“中国”为比较主体,“美国”为比较基准,“国土面积”为比较点,即主体和基准之间比较的共同属性,而比较结果是“大”。
依照比较所描述的位置关系,可以将比较进一步划分成几个次范畴。具体的划分方法,语言学界尚存在一些争议,主要分歧在差比和极比的关系,以及差比的细分等方面。考虑比较的语义,我们将比较划分为以下几个次范畴:
2.2 语义上的比较
尽管学术界对比较的语义范畴争议不大,但对比较句的具体外延,即哪些句子是比较句,并没有统一的意见。一般来说,形如“X比Y R”1、“X不如Y R”、“X有/没有Y R”、“X跟Y一样R”等的句子,大家公认为比较句。但对“越……越……”、“越来越R”、“连Y都/也R”、“X比较R”、“与其Y,不如X”等形式的句子,意见不一。对于这个问题,我们认为应当从句子的语义出发,看其中心语义是否是一个比较。
· 形如“越……越……”、“越来越R”的“递比句”不是比较句,因为这些句子中难以确定比较主体和比较基准。
· 形如“连Y都/也R”的句子不是比较句。这样的句子实际是一个三段论的小前提。这个表述中隐含的大前提是“X比Y R”,其结论是“X也R”。然而,这个比较并非基于显式的表达,而是基于人们的认知。同时,比较的主体也没有在句中出现。
· “X比较R”不是比较句。“比较”一词兼有相对程度和绝对程度的含义,语义模糊。
· 如果一个句子的主干不是比较句,那么这个句子不是比较句。例如:“最终我们获得了成功”。在这个句子中,虽然“最终”表述了时间维度上的尤最,但它只是一个修饰成分,并不是句子的主要含义。
· “与其Y,不如X”是比较句。虽然这些句子在语义上表达一种选择或建议,但比较的主体和基准是明确的,而且确实表述了一种高下关系,符合比较句的定义。
· 对比句是比较句。对比指把两种不同的事物或者同一事物的两个方面放在一起相互比较的一种辞格。例如:“这张桌子新,那张桌子旧。”尽管对比句有自身特殊的句法形式,但它确实描述了两个
您可能关注的文档
最近下载
- 行政事业单位会计考试试题及答案解析.docx
- 【新教材适用】2025秋人教八年级上册数学知识清单(1).pdf VIP
- 冶金行业概况介绍.pptx VIP
- WS∕T 225-2024 临床化学检验血液标本的采集与处理.pdf
- 专题07 标点符号六年级语文专项提升(统编版).docx VIP
- 【全册教案】2025-2026学年(统编版2024)七年级道德与法治上册全册教学设计(教案)+全册期末复习清单.docx
- 《手术室查对制度》课件 .ppt VIP
- 2408 操作手册.pdf VIP
- 机器人行业市场前景及投资研究报告:小米机器人更新迭代,AISoC芯片受益.pdf VIP
- 电子行业专题报告:边缘AI浪潮已至,AISoC赋能终端奋楫争流.docx VIP
原创力文档


文档评论(0)