- 2
- 0
- 约4.77千字
- 约 11页
- 2026-04-17 发布于浙江
- 举报
第四节文本数据处理/数据可视化/大数据典型应用
1.文本数据处理的主要步骤由下列部分组成:
①分词②文本数据获取③规律排列
④数据分析⑤结果呈现⑥特征提取
正确的顺序是(C)
A.②①⑥③④⑤
B.②⑤①④⑥
C.②①⑥④⑤
D.①②③⑤④⑥
【解析】典型的文本数据处理过程主要包括分词、特征提取、数据分析、结果呈现等,没有“规律排列”这一步骤。
2.下列选项中,不是常用中文分词算法的是(D)
A.基于字符匹配的分词方法
B.基于统计的分词方法
C.基于规则的分词方法
D.基于人工操作的分词方法
【解析】常用的中文分词算法有基于词典的分词方法(也称作基于字符匹配的分词方法)、基于统计的分词方法、基于规则的分词方法。
3.Python中可以实现对中文文本进行分词的模块是(D)
A.Pandas
B.matplotlib
C.Wordcloud
D.jieba
【解析】Python的中文分词模块jieba是基于字典的分词方法。
4.下列关于分词的说法,正确的是(A)
A.分词就是将一个汉字序列切分成一个个单独的词
B.中文分词不涉及复杂的关键词提取方法
C.目前的分词算法已经实现了完全准确的分词
D.常用的中文分词方法只有一种
【解析】英文分词不涉及复杂的关键词提取方法;目前分词算法还不能实现完全准确的分词;常用的
您可能关注的文档
- 五、 网络系统课时练 课件 2025-2026学年高中信息技术 必修2 信息系统与社会.pptx
- 五、 网络系统课时练 2025-2026学年高中信息技术 必修2 信息系统与社会.docx
- 四、 传感与控制课时练 课件 2025-2026学年高中信息技术 必修2 信息系统与社会.pptx
- 四、 传感与控制课时练 2025-2026学年高中信息技术 必修2 信息系统与社会.docx
- 一、 信息技术、信息系统及其组成课时练 高中信息技术 必修2 信息系统与社会.pptx
- 一、 信息技术、信息系统及其组成课时练 高中信息技术 必修2 信息系统与社会.docx
- 综合核心素养测评卷(一) 课件 2025-2026学年高中信息技术 必修2 信息系统与社会.pptx
- 综合核心素养测评卷(一) 2025-2026学年高中信息技术 必修2 信息系统与社会.docx
- 综合核心素养测评卷(二) 课件 2025-2026学年高中信息技术 必修2 信息系统与社会.pptx
- 综合核心素养测评卷(二) 2025-2026学年高中信息技术 必修2 信息系统与社会.docx
- 第三节 利用matplotlib模块绘图 同步练 课件 高中信息技术 必修1 数据与计算.pptx
- 第三节 利用matplotlib模块绘图 同步练 高中信息技术 必修1 数据与计算.docx
- 第四节 Python常用内建函数及顺序结构 同步练 课件 高中信息技术 必修1 数据与计算.pptx
- 第四节 Python常用内建函数及顺序结构 同步练 高中信息技术 必修1 数据与计算.docx
- 第三节 Python基本数据结构 同步练 课件 高中信息技术 必修1 数据与计算.pptx
- 第三节 Python基本数据结构 同步练 高中信息技术 必修1 数据与计算.docx
- 第六节 Python循环结构的程序实现 同步练 课件 高中信息技术 必修1 数据与计算.pptx
- 第六节 Python循环结构的程序实现 同步练 高中信息技术 必修1 数据与计算.docx
- 第三节 数据管理与大数据 同步练(含答案) 2025-2026学年高中信息技术 必修1 数据与计算.pptx
- 第三节 用算法解决问题的过程 同步练 课件 高中信息技术 必修1 数据与计算.pptx
最近下载
- 《表里的生物》优质教案(第二课时) .pdf VIP
- 四年级语文国测模拟试卷.docx VIP
- 2026年北京市自来水集团有限责任公司校园招聘笔试备考试题及答案解析.docx VIP
- 04_103-2004散发性能检验气味性试验_试行_ 试验测试标准.pdf VIP
- 《合成氨工艺》课件.ppt VIP
- 建筑(项目)全生命周期管理平台工程建设资料管理系统操作指南.pdf
- 2025第三届全国技能大赛海南省选拔赛-电子技术(世赛选拔)项目技术文件.pdf VIP
- 人教版小学五年级下册数学精品教学课件 第七单元 折线统计图 7.1 认识折线统计图.ppt VIP
- 2025年北京市自来水设计有限责任公司招聘笔试真题.docx VIP
- 机械工程学报格式排版.docx VIP
原创力文档

文档评论(0)