自考本科《语言学概论》第十二章 语言与科学技术 核心速记清单(精简版).docxVIP

  • 0
  • 0
  • 约1.03千字
  • 约 2页
  • 2026-03-02 发布于山西
  • 举报

自考本科《语言学概论》第十二章 语言与科学技术 核心速记清单(精简版).docx

自考本科《语言学概论》第十二章语言与科学技术核心速记清单(精简版)

一、核心概念

中文信息处理:用计算机对汉语的字、词、句、篇进行处理(输入、存储、分析、输出),是语言与科技结合的核心领域。

机器翻译:利用计算机将一种自然语言转换为另一种自然语言,分规则型、统计型、神经型(主流)。

语料库:经加工的大规模电子文本库,分通用语料库、专用语料库,是语言研究和科技应用的基础。

语音识别/合成:语音识别(语音→文字)、语音合成(文字→语音),统称语音信息处理。

自然语言理解:计算机理解自然语言的语义和语用,是NLP的核心目标。

二、中文信息处理的难点(高频考点)

汉字特点:数量多、字形复杂,无天然分词界限(拼音文字有空格分隔)。

词汇层面:多义词、兼类词多,新词不断产生,词语搭配灵活。

语法层面:缺乏严格形态变化,语序和虚词是主要语法手段,歧义句多。

语义层面:语义关系复杂,依赖语境和文化背景。

三、语言信息处理的主要领域

字处理:汉字编码(输入码:拼音、五笔;机内码、输出码)、汉字识别(手写/印刷体)。

词处理:自动分词、词性标注、词义消歧(解决多义词问题)。

句处理:句法分析、歧义消解、机器翻译、文本分类。

篇章处理:文本摘要、信息检索、情感分析、问答系统。

四、机器翻译的发展阶段

规则型MT:基于语法和词汇规则,需人工编写规则,适配性差。

统计型MT:基于大规模平行语料库,通过统计规律翻译,依赖语料质量。

神经型MT(NMT):基于深度学习,端到端翻译,翻译效果最接近人工,当前主流。

难点:文化负载词翻译、语境适配、句式转换的自然性。

五、语料库语言学的应用

为语言研究提供实证数据(如词汇使用频率、语法规律)。

支撑中文信息处理(分词、标注、机器翻译的语料基础)。

应用于语言教学(编写教材、设计练习题)、辞书编纂(精准释义、举例)。

六、语言与人工智能的关系

语言是AI的核心载体:自然语言处理(NLP)是人工智能的重要分支。

AI推动语言研究:从传统定性研究转向定量+定性的实证研究。

典型应用:智能客服、语音助手、机器翻译、文本生成(如ChatGPT)。

七、重点考点总结

中文信息处理的核心难点(分词、字形、语法无形态)。

机器翻译的三个发展阶段及主流类型(神经型)。

语料库的定义和作用。

语音信息处理的两大类型(识别/合成)。

语言在人工智能中的地位(核心载体,NLP是AI分支)。

文档评论(0)

1亿VIP精品文档

相关文档