- 1
- 0
- 约4.62千字
- 约 27页
- 2026-04-17 发布于浙江
- 举报
;;1.文本数据处理的主要步骤由下列部分组成:
①分词②文本数据获取③规律排列
④数据分析⑤结果呈现⑥特征提取
正确的顺序是()
A.②①⑥③④⑤ B.②⑤①④⑥
C.②①⑥④⑤ D.①②③⑤④⑥
【解析】典型的文本数据处理过程主要包括分词、特征提取、数据分析、结果呈现等,没有“规律排列”这一步骤。;2.下列选项中,不.是.常用中文分词算法的是()
A.基于字符匹配的分词方法
B.基于统计的分词方法
C.基于规则的分词方法
D.基于人工操作的分词方法
【解析】常用的中文分词算法有基于词典的分词方法(也称作基于字符匹配的分词方法)、基于统计的分词方法、基于规则的分词方法。;3.Python中可以实现对中文文本进行分词的模块是()
A.pandas B.matplotlib
C.wordcloud D.jieba
【解析】Python的中文分词模块jieba是基于字典的分词方法。;4.下列关于分词的说法,正确的是()
A.分词就是将一个汉字序列切分成一个个单独的词
B.中文分词不涉及复杂的关键词提取方法
C.目前的分词算法已经实现了完全准确的分词
D.常用的中文分词方法只有一种
【解析】英文分词不涉及复杂的关键词提取方法;目前分词算法还不能实现完全准确的分词;常用的中文分词方法有三种。;5.
您可能关注的文档
- 五、 网络系统课时练 课件 2025-2026学年高中信息技术 必修2 信息系统与社会.pptx
- 五、 网络系统课时练 2025-2026学年高中信息技术 必修2 信息系统与社会.docx
- 四、 传感与控制课时练 课件 2025-2026学年高中信息技术 必修2 信息系统与社会.pptx
- 四、 传感与控制课时练 2025-2026学年高中信息技术 必修2 信息系统与社会.docx
- 一、 信息技术、信息系统及其组成课时练 高中信息技术 必修2 信息系统与社会.pptx
- 一、 信息技术、信息系统及其组成课时练 高中信息技术 必修2 信息系统与社会.docx
- 综合核心素养测评卷(一) 课件 2025-2026学年高中信息技术 必修2 信息系统与社会.pptx
- 综合核心素养测评卷(一) 2025-2026学年高中信息技术 必修2 信息系统与社会.docx
- 综合核心素养测评卷(二) 课件 2025-2026学年高中信息技术 必修2 信息系统与社会.pptx
- 综合核心素养测评卷(二) 2025-2026学年高中信息技术 必修2 信息系统与社会.docx
原创力文档

文档评论(0)