- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
期末试卷A-同济大学.pdf
同济大学中文信息处理期末考试A 卷及答案
课程名称:中文信息处理 专业:计算机科学与技术、信息安全
学号: 姓名: 成绩:
一、填空题:(每题3 分,共30 分)
1、分词单位是指汉语信息处理使用的、具有确定的语义或语法功能的基本单位,
包括 词 和少量 词组。
2、所谓框架,是由槽(Slot)、侧面(Facet)、视点(View)和填充值(Filler)
组成的抽象数据结构。
3、机械方法分词方法无法解决分词阶段的两大问题——歧义切分问题和未登录
词识别问题,影响了分词的准确率。
4、对于语法分析分析而言,自动标注的性能采用句子级性能来衡量较好。
5、对于齐次的马尔可夫过程而言,一旦知道了它的初始分布和转移概率矩阵,
它的统计性质,即它的任意有限维分布就完全确定了。
6、若将词的生成过程看作一个HMM,其中 词性或概念序列 构成一个时齐的马
尔可夫过程, 由词性或概念标记生成词的过程 则服从多项概率分布。
7、在上下文无关(CFG)规则库中出现的符号包括: 终结符和非终结符。通常地,
终结符就是词典类,非终结符就是复合语法结构。
8、将一个句子映射到它的逻辑形式的过程称为语义解释。
9、动词及其参数之间存在一组抽象的语义关系,这些关系一般称为论旨角色或
者格角色(case role)。
10、自然语言处理是计算机科学领域与人工智能领域中的一个重要研究方向。它
研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
二、简答题:(每题7 分)
1、什么是自然语言理解,什么是自然语言生成?请列举三个自然语言研究的应
用领域。
答:自然语言理解指计算机能理解自然语言文本的意义。
自然语言生成指计算机用自然语言来表达给定的意图、思想等。
1
自然语言研究的应用有机器翻译、全文检索、自动文摘、语音识别、会话系统等。
(评分标准:前两个问题每答对1个得2 分,最后一个问题每列举一个得1 分)
2、请运用树结构形式表示下面句子的结构。
位老人在公园散步。
(评分标准:全部划对得满分,划错任何一条线不得分,词性标错1个扣1 分)
3、在语义分析阶段,采用选择限制法消除歧义的基本思想是什么?
答:在语义分析阶段采用选择限制法消除歧义的基本思想是把不同对象之间存在
的不相交、子类、意义重叠等关系定义为一种语义上的抽象层次关系,确定可共
现意义的合法组合,并排除由语法分析器构造的那些前后不一致的形式。
(评分标准:本题答出思想即可得满分)
三、请描述下面句子采用逆向最小匹配分词的过程(设MAXL=4)。(本题 10 分)
他的确切地址在这里。
答: 1)从右到左首先切分出 “这里”;
2)然后在字典中查 “址在”,找不到,再在字典中查“地址在”,依然找不
2
到,再查找“切地址在”,找不到,所以切分出 “在”;
3)在字典中查“地址”,找到,切分出 “地址”;
4)在字典中查“确切”,找到,切分出 “确切”;
5)在字典中查找“他的”,找不到,切分出 “的”;
6)切分出 “他”。
或:
按照从右到左的顺序,首先从汉字串中取长度为2 的子串查词典。若词典中存在
这个词,则切分出该子串,指针左移2 个汉字后继续切分,否则,子串长度加一,
再与词典匹配。若长度为MAXL 的子串还不能在词典中查到,则取当前汉字为词,
指针左移一个汉字继续匹配。重复上述过程。
(评分标准:给出以上任何一种答案 可得分,各种答案中每错1 步扣2 分)
四、请根据下面的语法规则,给出下面句子的双向图语法分析过程。(本题 12
分)
他是好学生。
答:
3
如果给出下面的过程也可得大部分分值语法规则如下:(#pronoun 示pronoun
是触发类)
⑴ NP #pronoun
⑵ NP #noun
⑶ NP #adj noun
⑷ VP #verb
⑸ SUBJ #NP
⑹ PRED #VP NP
⑺ SSUBJ #PRED
五、请根据给定的语法规则、ACTION 表和GOTO 表,写出对下面句子进行L
文档评论(0)