(共21页PPT)数据可视化第一课时哲教学课件.pptxVIP

  • 1
  • 0
  • 约小于1千字
  • 约 21页
  • 2026-03-29 发布于广东
  • 举报

(共21页PPT)数据可视化第一课时哲教学课件.pptx

数据可视化哲学校某省市衢州第二中学年级:高二年级学科:高某著名企业息技术(浙教版)

文本处理的一般过程数据获取分词特征提取分析结果呈现

让计算机“认词语”得力大品牌,值得人们信赖!得力/大/品牌/值得/人们/信赖

目前的分词算法通常分为三类:①基于词典(右图即jieba采用的部分词典)②基于频率统计③基于规则(人工智能分析)

特征提取 选取词或短语作为文本的特征项1.通常可直接用分词算法和词频统计得出的结果做为特征词2.找出最具代表性、最有效的文本特征,通常的办法就是通过特征提取来减少特征词的数量,提高文本处理的速度和效率

标签云

(1)快捷观

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档