- 2
- 0
- 约1.2万字
- 约 10页
- 2021-11-12 发布于四川
- 举报
六 ——文本挖掘
考点一:分类
文本的表示及其特征项的选取是文本挖掘、信息检索的一个基本问题,它把从文本中抽取出
的特征词进行量化来表示文本信息。将它们从一个无结构的原始文本转化为结构化的计算机
可以识别处理的信息,即对文本进行科学的抽象,建立它的数学模型,用以描述和代替文本。
使计算机能够通过对这种模型的计算和操作来实现对文本的识别。由于文本是非结构化的数
据,要想从大量的文本中挖掘有用的信息就必须首先将文本转化为可处理的结构化形式。目
前人们通常采用向量空间模型来描述文本向量.
但是如果直接用分词算法和词频统计方法得到的特征项来表示文本向量中的各个维
您可能关注的文档
- 市场拓展篇水讲解课件.pptx
- 电动笼式平衡调节阀.pdf
- 讲义参考分析.pptx
- 老师教你如何进行argument写作.pdf
- 淘宝买测屏工具送的教程c51496gnfj ab.pdf
- 第6章时序逻辑电路.pptx
- atv御程系列atv630全部编程手册programming.pdf
- 资料文稿复合材料展sampe.pptx
- ict新技术移动互联网思维.pptx
- 内容教程案例toshiba东芝.pdf
- 2026湖北私立学校教师初高中教师招聘笔试模拟试题及答案解析.docx
- 2026江苏南通市第一人民医院招聘备案制工作人员102人备考题库及参考答案详解(轻巧夺冠).docx
- 2026江苏南通市第一人民医院招聘备案制工作人员102人备考题库及参考答案详解(综合题).docx
- 2026广西南宁威宁集团第一季度招聘38人笔试模拟试题及答案解析.docx
- 2026江苏南通市第一人民医院招聘备案制工作人员102人备考题库及参考答案详解(新).docx
- 2026江苏南通市第一人民医院招聘备案制工作人员102人备考题库及参考答案详解(实用).docx
- 2026甘肃省妇幼保健院(甘肃省中心医院)招聘(第二期)笔试模拟试题及答案解析.docx
- 2026江苏南通市第一人民医院招聘备案制工作人员102人备考题库及参考答案详解(实用).docx
- 2026江苏南通市第一人民医院招聘备案制工作人员102人备考题库及参考答案详解(基础题).docx
- 2026江苏南通市第一人民医院招聘备案制工作人员102人备考题库及参考答案详解(研优卷).docx
最近下载
- YS_T 1260-2018锆及锆合金管材 环向拉伸试验方法.pdf
- NB∕T 20538-2018 压水堆核电厂燃料包壳用锆合金管材.pdf
- T_CNS 145-2025 Cr涂层锆合金包壳单应力小冲杆环向蠕变试验方法.pdf VIP
- 公路沥青路面施工技术规范.doc VIP
- YS∕T 1463-2021 锆合金管材内压蠕变试验方法.pdf
- 反射和反射弧.pptx VIP
- C30EV出租版-维修-悬架系统 A05-C30EV.pdf VIP
- C30EV出租版-维修-制动系统 A07-C30EV.pdf VIP
- 国际制药工程协(ISPE)制药工程基本指南水和蒸汽系统.doc VIP
- CRH380B平台动车组紧急制动UB环路分析及不缓解故障研究.pdf VIP
原创力文档

文档评论(0)