- 1、本文档共2页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
5.7项目练习
一、选择题
1.将原始文本转换为计算机可以有效处理的格式,不包括下列哪个过程?(B)。
A.预处理B.采样C.分词D.编码
2.预处理后的文本需要拆分为单词,也称为什么?(A)。
A.tokenB.样本C.wordD.分词
3.词嵌入技术的主要作用是什么?(A)
A.将单词转换为具有语义的向量B.将句子转换为图像C.统计单词数量D.将文本编码为二进制代码
4.句子由多个单词组成,可以将句子中单词的词向量进行拼接,形成什么?(D)
A.文档B.句子C.主题D.句向量
5.在自然语言处理中,情感分析的主要目的是什么?(C)
A.确定单词在句子中的位置B.提取句子的主题C.识别句子的情感倾向D.识别单词的词性(如名词、动词等)
二、填空题
1.将文本中的词汇转换为______,使模型能够更准确地理解文本内容。
答案:词向量
2.在自然语言处理中,词嵌入把单词(word)转换成实数向量(vector),因此大家都也把词嵌入称为_______。
答案:word2vec
3.词嵌入主要采用______模型来实现。
答案:神经网络
三、简答题
1.简述将句子中的单词表示为独热编码的步骤。
答案:第一步预处理:文本需要标准化以确保一致性,如删除标点符号,对于英文来说还需要统一字母大小写,或者一些缩写的形式,比如:“I’m”和“Iam”。第二步分词:将文本拆分为单词,也称为token。例如,句子“我爱北京天安门”,分词结果为:“我/爱/北京/天安门”,如果是英文句子则可以根据单词之间的空格进行拆分。第三部编码:将每个token转换为一个跟句子长度一样的向量,向量中只在该词出现的位置设置为1,其余全部为0。
2.简述用神经网络对“我正在学习人工智能”这句话中的“学习”进行词嵌入的过程。
答案:首先,把句子进行分词,生成“我”,“正在”,“学习”,“人工智能”。然后,将这几个单词一同输入神经网络,这样能够更好的表现“学习”在语句中的含义与位置,输入到神经网络的是这些单词的编码,可以是简单的数字编码,也可以是独热编码。最后,神经网络输出“学习”这个词的词向量。
您可能关注的文档
- 形象礼仪与化妆 课件 模块三社交礼仪.pptx
- 人工智能应用基础 习题及答案 项目1 练习题.docx
- 人工智能应用基础 习题及答案 项目2练习题.docx
- 人工智能应用基础 习题及答案 项目3练习题.docx
- 人工智能应用基础 习题及答案 项目4练习题.docx
- 人工智能应用基础 习题及答案 项目6练习题.docx
- 人工智能应用基础 习题及答案 项目7练习题.docx
- 人工智能应用基础 习题及答案 项目8练习题.doc
- 人工智能应用基础 习题及答案 项目9 练习题.docx
- 人工智能应用基础 习题及答案 项目10 练习题.docx
- 基本面选股组合月报:大模型AI选股组合本年超额收益达6.60.pdf
- 可转债打新系列:安集转债,高端半导体材料供应商.pdf
- 可转债打新系列:伟测转债,国内头部第三方IC测试企业.pdf
- 联想集团PC换机周期下的价值重估.pdf
- 计算机行业跟踪:关税升级,国产突围.pdf
- 科技类指数基金专题研究报告:详解AI产业链指数及基金布局.pdf
- 计算机行业研究:AIAgent产品持续发布,关税对板块业绩影响较小.pdf
- 民士达深度报告:国内芳纶纸龙头,把握变局期崛起机遇.pdf
- 社会服务行业动态:全球首张民用无人驾驶载人航空器运营合格证落地,霸王茶姬冲击美股IPO.pdf
- 通信行业研究:特朗普关税令落地,长期看好国产算力链.pdf
文档评论(0)