网站大量收购独家精品文档,联系QQ:2885784924

人工智能应用基础 习题及答案 项目5练习题.docx

人工智能应用基础 习题及答案 项目5练习题.docx

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

5.7项目练习

一、选择题

1.将原始文本转换为计算机可以有效处理的格式,不包括下列哪个过程?(B)。

A.预处理B.采样C.分词D.编码

2.预处理后的文本需要拆分为单词,也称为什么?(A)。

A.tokenB.样本C.wordD.分词

3.词嵌入技术的主要作用是什么?(A)

A.将单词转换为具有语义的向量B.将句子转换为图像C.统计单词数量D.将文本编码为二进制代码

4.句子由多个单词组成,可以将句子中单词的词向量进行拼接,形成什么?(D)

A.文档B.句子C.主题D.句向量

5.在自然语言处理中,情感分析的主要目的是什么?(C)

A.确定单词在句子中的位置B.提取句子的主题C.识别句子的情感倾向D.识别单词的词性(如名词、动词等)

二、填空题

1.将文本中的词汇转换为______,使模型能够更准确地理解文本内容。

答案:词向量

2.在自然语言处理中,词嵌入把单词(word)转换成实数向量(vector),因此大家都也把词嵌入称为_______。

答案:word2vec

3.词嵌入主要采用______模型来实现。

答案:神经网络

三、简答题

1.简述将句子中的单词表示为独热编码的步骤。

答案:第一步预处理:文本需要标准化以确保一致性,如删除标点符号,对于英文来说还需要统一字母大小写,或者一些缩写的形式,比如:“I’m”和“Iam”。第二步分词:将文本拆分为单词,也称为token。例如,句子“我爱北京天安门”,分词结果为:“我/爱/北京/天安门”,如果是英文句子则可以根据单词之间的空格进行拆分。第三部编码:将每个token转换为一个跟句子长度一样的向量,向量中只在该词出现的位置设置为1,其余全部为0。

2.简述用神经网络对“我正在学习人工智能”这句话中的“学习”进行词嵌入的过程。

答案:首先,把句子进行分词,生成“我”,“正在”,“学习”,“人工智能”。然后,将这几个单词一同输入神经网络,这样能够更好的表现“学习”在语句中的含义与位置,输入到神经网络的是这些单词的编码,可以是简单的数字编码,也可以是独热编码。最后,神经网络输出“学习”这个词的词向量。

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档