自考本科《语言学概论》第十二章语言与科学技术核心速记清单（精简版）.docxVIP

下载本文档

0
0
约1.03千字
约 2页
2026-03-02 发布于山西
举报

自考本科《语言学概论》第十二章语言与科学技术核心速记清单（精简版）.docx

自考本科《语言学概论》第十二章语言与科学技术核心速记清单（精简版）

一、核心概念

中文信息处理：用计算机对汉语的字、词、句、篇进行处理（输入、存储、分析、输出），是语言与科技结合的核心领域。

机器翻译：利用计算机将一种自然语言转换为另一种自然语言，分规则型、统计型、神经型（主流）。

语料库：经加工的大规模电子文本库，分通用语料库、专用语料库，是语言研究和科技应用的基础。

语音识别/合成：语音识别（语音→文字）、语音合成（文字→语音），统称语音信息处理。

自然语言理解：计算机理解自然语言的语义和语用，是NLP的核心目标。

二、中文信息处理的难点（高频考点）

汉字特点：数量多、字形复杂，无天然分词界限（拼音文字有空格分隔）。

词汇层面：多义词、兼类词多，新词不断产生，词语搭配灵活。

语法层面：缺乏严格形态变化，语序和虚词是主要语法手段，歧义句多。

语义层面：语义关系复杂，依赖语境和文化背景。

三、语言信息处理的主要领域

字处理：汉字编码（输入码：拼音、五笔；机内码、输出码）、汉字识别（手写/印刷体）。

词处理：自动分词、词性标注、词义消歧（解决多义词问题）。

句处理：句法分析、歧义消解、机器翻译、文本分类。

篇章处理：文本摘要、信息检索、情感分析、问答系统。

四、机器翻译的发展阶段

规则型MT：基于语法和词汇规则，需人工编写规则，适配性差。

统计型MT：基于大规模平行语料库，通过统计规律翻译，依赖语料质量。

神经型MT（NMT）：基于深度学习，端到端翻译，翻译效果最接近人工，当前主流。

难点：文化负载词翻译、语境适配、句式转换的自然性。

五、语料库语言学的应用

为语言研究提供实证数据（如词汇使用频率、语法规律）。

支撑中文信息处理（分词、标注、机器翻译的语料基础）。

应用于语言教学（编写教材、设计练习题）、辞书编纂（精准释义、举例）。

六、语言与人工智能的关系

语言是AI的核心载体：自然语言处理（NLP）是人工智能的重要分支。

AI推动语言研究：从传统定性研究转向定量+定性的实证研究。

典型应用：智能客服、语音助手、机器翻译、文本生成（如ChatGPT）。

七、重点考点总结

中文信息处理的核心难点（分词、字形、语法无形态）。

机器翻译的三个发展阶段及主流类型（神经型）。

语料库的定义和作用。

语音信息处理的两大类型（识别/合成）。

语言在人工智能中的地位（核心载体，NLP是AI分支）。

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

自考本科《语言学概论》第十二章语言与科学技术核心速记清单（精简版）.docxVIP