- 0
- 0
- 约1.03千字
- 约 2页
- 2026-03-02 发布于山西
- 举报
自考本科《语言学概论》第十二章语言与科学技术核心速记清单(精简版)
一、核心概念
中文信息处理:用计算机对汉语的字、词、句、篇进行处理(输入、存储、分析、输出),是语言与科技结合的核心领域。
机器翻译:利用计算机将一种自然语言转换为另一种自然语言,分规则型、统计型、神经型(主流)。
语料库:经加工的大规模电子文本库,分通用语料库、专用语料库,是语言研究和科技应用的基础。
语音识别/合成:语音识别(语音→文字)、语音合成(文字→语音),统称语音信息处理。
自然语言理解:计算机理解自然语言的语义和语用,是NLP的核心目标。
二、中文信息处理的难点(高频考点)
汉字特点:数量多、字形复杂,无天然分词界限(拼音文字有空格分隔)。
词汇层面:多义词、兼类词多,新词不断产生,词语搭配灵活。
语法层面:缺乏严格形态变化,语序和虚词是主要语法手段,歧义句多。
语义层面:语义关系复杂,依赖语境和文化背景。
三、语言信息处理的主要领域
字处理:汉字编码(输入码:拼音、五笔;机内码、输出码)、汉字识别(手写/印刷体)。
词处理:自动分词、词性标注、词义消歧(解决多义词问题)。
句处理:句法分析、歧义消解、机器翻译、文本分类。
篇章处理:文本摘要、信息检索、情感分析、问答系统。
四、机器翻译的发展阶段
规则型MT:基于语法和词汇规则,需人工编写规则,适配性差。
统计型MT:基于大规模平行语料库,通过统计规律翻译,依赖语料质量。
神经型MT(NMT):基于深度学习,端到端翻译,翻译效果最接近人工,当前主流。
难点:文化负载词翻译、语境适配、句式转换的自然性。
五、语料库语言学的应用
为语言研究提供实证数据(如词汇使用频率、语法规律)。
支撑中文信息处理(分词、标注、机器翻译的语料基础)。
应用于语言教学(编写教材、设计练习题)、辞书编纂(精准释义、举例)。
六、语言与人工智能的关系
语言是AI的核心载体:自然语言处理(NLP)是人工智能的重要分支。
AI推动语言研究:从传统定性研究转向定量+定性的实证研究。
典型应用:智能客服、语音助手、机器翻译、文本生成(如ChatGPT)。
七、重点考点总结
中文信息处理的核心难点(分词、字形、语法无形态)。
机器翻译的三个发展阶段及主流类型(神经型)。
语料库的定义和作用。
语音信息处理的两大类型(识别/合成)。
语言在人工智能中的地位(核心载体,NLP是AI分支)。
您可能关注的文档
最近下载
- 教师党员一对一谈心谈话记录.docx VIP
- F453020【复试】2024年陕西理工大学0860生物与医药《加试生物化学》考研复试仿真模拟5套卷.pdf VIP
- DB22_T 5115-2022 房屋建筑和市政基础设施工程安全管理资料标准.docx VIP
- 2025-2026学年初中艺术·美术湘美版2024七年级下册-湘美版2024教学设计合集.docx
- 2025年江西省赣州市事业单位招聘笔试题(附答案).docx
- 瓢偏度的测量 (1).pptx VIP
- 西门子6SE70变频器说明书.pdf
- 《中华商业文化》第一章 商史文化.pptx VIP
- 松下面包机SD-PT1000使用说明书.pdf
- 新解读《房屋建筑和市政基础设施工程安全管理资料标准 DB22_T 5115-2022》最新解读.docx VIP
原创力文档

文档评论(0)