[结构主义建模.pptVIP

  • 2
  • 0
  • 约8.79千字
  • 约 36页
  • 2017-01-09 发布于北京
  • 举报
[结构主义建模

根据专业知识,词频及具有分类的特征信息,——信息熵!因此可以仿照熵的定义: 某词W(i)在文本d 中出现的频数 × log( ) 集合中文本总数 词W(i)在文本中至少 出现一次的文本数 这里熵的形式,一来用类似信息熵的定义,符合“分类”的特征信息的概念;二来,词频的作用大于词在文本集合中出现的作用。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 假设TF(w(i),dj)是词w(i)在文本dj中出现的次数,|D|是D中文本总数,DF(w(i))是指在D中至少出现一次w(i)的文本数。则每一个文本dj∈D,和一个特征词w(i)存在一量: 形式化: 记d(i)j =TFIDF(w(i),dj) ,则每一个文本dj∈D,存在一个分量适当排序的文本向量。    Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 文本向量空间模型与文本向量:    Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 问题的目标:文本集的分类 原型的结构分析: 文本集的结构(目标)+文本的结构(表示的关键) 同构分析: 数学结构和原型结构的联系 文本集的结构≌线性空间结构 数学模型表示: 文本向量空间+文本向量(词频表示的分量) 建模过程 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 文本自动分类: 理解文本的类属性,子空间分类. 文本自动聚类: 发现文本集合中的新模式,新概念. 文本向量: 由文本的实意词的特征值或特征模式为分量的向量. 以信息熵的形式构造. 特征子空间: 具有某种共同意义的分量组成的子空间. 主义 自由 个人 文本向量空间: 全部文本向量的高维线性空间. 应用事例:思想史研究中,“五四” 运动的讨论的主要思想是什么? 发现在“自由主义”的特征词所在的子空间中,文本的投影数量最大! Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 例题小结: 本题几乎没有人见过类似的问题。这为“引模”带来了不少困难。 如果有结构化建模的理念,而且熟悉线性代数,就比较容易通过一定的思考产生模型的。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. * * 结构主义数学建模方法 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 一、引子:建模=引模? 大学生的问题:数学建模 = 数学引模 ? 一个数学建模培训教学流程: 介绍建模五步法(一节课); 工具训练(四节课); 讲解案例(二十节课); 练习(十节课). 分析实际问题的系统方法?建模的一般方法? Eva

文档评论(0)

1亿VIP精品文档

相关文档