《计算语言学》试卷附答案.docxVIP

下载本文档

0
0
约4.85千字
约 12页
2025-08-21 发布于四川
举报
版权申诉

《计算语言学》试卷附答案.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

《计算语言学》试卷附答案

一、单项选择题（每题2分，共20分）

1.以下哪项不属于计算语言学的核心研究目标？

A.开发自然语言处理系统（如机器翻译、问答系统）

B.分析语言的历史演变规律（如古汉语到现代汉语的语音变化）

C.构建语言的形式化模型（如句法树、语义网络）

D.利用统计方法挖掘语言数据中的模式（如词频分布、共现关系）

2.乔姆斯基（Chomsky）提出的形式语法体系中，上下文无关语法（Context-FreeGrammar,CFG）对应哪一型语法？

A.0型（无约束短语结构语法）

B.1型（上下文有关语法）

C.2型（上下文无关语法）

D.3型（正则语法）

3.在隐马尔可夫模型（HiddenMarkovModel,HMM）中，“状态”与“观测”的关系是？

A.状态是可直接观测的，观测是隐含的

B.状态是隐含的，观测是可直接获取的

C.状态与观测一一对应，均为可观测变量

D.状态与观测无直接关联，由外部特征决定

4.中文分词中的“交集型歧义”是指？

A.一个字符串存在两种以上不同的切分方式，且切分结果有部分重叠（如“乒乓球拍卖完了”可切为“乒乓球/拍卖/完了”或“乒乓/球拍/卖完了”）

B.一个字符串的切分结果完全不重叠（如“大学生活动中心”可切为“大/学生/活动/中心”或“大学/生/活动/中心”）

C.切分结果中存在生僻词，导致歧义（如“门把手”切为“门/把手”或“门把/手”）

D.因标点符号缺失导致的歧义（如“他说的对吗”切为“他说/的/对吗”或“他/说的/对吗”）

5.以下哪种方法不属于句法分析（SyntacticParsing）的常用技术？

A.基于规则的递归下降分析（RecursiveDescentParsing）

B.最大熵模型（MaximumEntropyModel）

C.依存句法分析（DependencyParsing）

D.情感极性分析（SentimentPolarityAnalysis）

6.计算词的相似度时，若使用向量空间模型（VectorSpaceModel），“余弦相似度”衡量的是？

A.两个向量的长度差异

B.两个向量的方向一致性

C.两个向量的维度数量

D.两个向量的元素和的比值

7.语料库标注（CorpusAnnotation）中，“词性标注”（Part-of-SpeechTagging）的主要目的是？

A.标注词语的情感倾向（如褒义、贬义）

B.标注词语在句子中的语法功能（如名词、动词）

C.标注词语的历史来源（如古汉语、外来词）

D.标注词语的发音特征（如声母、韵母）

8.在统计机器翻译（StatisticalMachineTranslation,SMT）中，“翻译模型”（TranslationModel）主要处理的问题是？

A.源语言到目标语言的词序调整

B.源语言短语与目标语言短语的对应概率

C.目标语言句子的流畅性评估

D.源语言句子的句法结构分析

9.以下哪项属于语义分析（SemanticAnalysis）的任务？

A.计算句子的字符长度

B.识别句子中的命名实体（如人名、地名）

C.统计文本中的重复词汇

D.检测句子的语法错误

10.在神经网络模型（如LSTM、Transformer）中，“注意力机制”（AttentionMechanism）的核心作用是？

A.减少模型的参数量

B.增强模型对序列中长距离依赖的捕捉能力

C.加速模型的训练速度

D.提高模型的可解释性

二、填空题（每空2分，共20分）

1.计算语言学的两大研究范式是__________（基于规则）和__________（基于数据）。

2.形式语言中，正则语法（3型语法）可被__________（自动机类型）识别。

3.隐马尔可夫模型的三个基本问题是：评估问题（给定观测序列求概率）、__________（给定观测序列求最可能的状态序列）、__________（给定观测序列估计模型参数）。

4.中文分词的主要歧义类型包括交集型歧义、__________（如“他将来北京”中的“将来”与“将/来”）。

5.句法分析的输出通常是__________（如短语结构树）或__________（如依存关系图）。

6.词嵌入（WordEmbedding）的典型方法包括__________（基于全局统计的矩阵分解）和__________（基于局部

您可能关注的文档

文档评论（0）

183****5731 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

《计算语言学》试卷附答案.docxVIP