* * * * * * * * 说明: 1.商业上用“商圈”来描述商店的覆盖范围。影响商店选址的主要因素是商圈内的人流量,以及购物欲望。2.为简化,假定鸟巢(国家体育场)容量10万人,水立方(国家游泳中心)容纳4万人,国家体育馆可容纳6万人。每个看台容1万人,出口对准一个商区,各商区面积相同,图中白色为人行道路。 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 总体分析结论: 显然,通过条件、目标的理解我们可以得到影响力评估的两个主要内容:关注度和影响力内涵的评估。选择一两个重点领域和某个适当的视角进行比对,形成评估方法。 具体分析: 目标的“量化”要求,对于关注度显然是统计模型进行分析;而影响力内涵的评估模型是什么呢? 必须建立文本的理解与分析模型,基于文本分类的模型。 理解与分析: 理解基于分类,理解就是分类! Web中的问题: 在网上,每天有成千上万的多媒体文件在传输。试建立数学模型,使得可以对这些文件进行自动分类,以便人们阅读和使用。 如何建立文本分类的数学模型? 在线文本自动分析 原型的目标: 在线电子文本的计算机自动分类与辅助理解。 两类“分类模型”的目标: 检索性分类——国际图书分类法,目的是查询; 理解性分类——基于语意、概念层、主题层的细分类,目的是分析和理解。 1)建立专业模型 原型的结构分析 文本——章节——段落——语意团 ——句或短语——词——字符 文本的结构: 原型有两层结构:文本的结构, 文本集合的结构。 分析:文本集合的结构依赖于文本的结构; 文本集合的结构是原型对于目的的主要结构; 因此文本的结构的表示依赖文本集合的结构。 原型的专业模型(源于关键词和摘要的作用的理解) 模型1. 以词频为特征的分类模型 词: 有语意的初级字符串单位——语言的细胞; 词在文本中的频率与不同类文本间频率差别是分类的基本特征和基本的结构性差别。 模型2. 以语意团为特征,重在语意差别的分类。 模型3. 混合模型 语言能力模型:乔姆斯基的语法结构模型是另一类语言模型,目的是一般语言的生成结构。 文本集的结构分析:分类是在文本的集合中进行,因此是原型的用于分类目标的主要结构。 联想到数学中的结构,例如代数结构,是在集合中定义代数运算——加法和数法:元素间的运算关系 两个文本的合并还是文本——加法封闭; 一个文本的倍数仍然是文本——数乘封闭! 分析文本集的结构,首先是文本之间的相互关系: 两个文本合并是什么?还是文本! 2)同构分析 同构: 此时问题的原型的结构直接和数学结构联系起来! 建立原型结构的数学表示则建立了数学模型。 文本的集合应该有一个“线性空间”的结构; 文本的分类是在线性空间中的“向量的分类”! 具有高等代数的知识,对于线性代数的结构有清楚的理解和关注,则容易发现: 以上分析导至文本向量的概念: 每个文本对应地定义一个文本向量,用于分类,分量如何定义? 显然,分量是“分类特征”的具体表示: 基于词频以及用于区分文本的量化的表示—分析! 模型1的数学模型:向量空间的结构+词频特征。 3)同构表示与数学建模 根据专业模型,词频及具有分类的特征信息,因此可以仿照熵的定义: 假设TF(w(i),dj)是词w(i)在文本dj中出现的次数,|D|是D中文本总数,DF(w(i))是指在D中至少出现一次w(i)的文本数。则每一个文本dj∈D,和一个特征词w(i)存在一量: 这里熵的形式,一来用类似信息熵的定义,符合“分类”的特征信息的概念:好的分类,信息增益;二来,词频的作用大于词在文本集合中出现的作用。 记d(i)j =TFIDF(w(i),dj) ,则每一个文本dj∈D,存在一个分量适当排序的文本向量: 文本集合的数学模型——文本的特征向量的空间, 分类问题是N维线性空间中的向量的分类问题。 许多方法可以用于求解,例如SVM分类器对于数据压缩很有效。 文本自动分类: 理解文本的类属性,子空间分类. 文本自动聚类: 发现文本集合中的新模式,新概念. 文本向量: 由文本的实意词的特征值或特征模式为分量的向量. 以信息熵的形式构造. 特征子空间: 具有某种共同意义的分量组成的子空间. 主义 自由 科学 文
您可能关注的文档
- 护理腹部查体.ppt
- 护理查房样板(1).ppt
- 护肤陈列管理.ppt
- 报任安书简洁版.ppt
- 抽样检验的培训教材易懂版.pptx
- 担保品管理服务介绍2016update.pptx
- 拉深模的类型与结.pptx
- 招标文件范本(2009).pptx
- 招联好期贷贷款你想要了解的6个问题.pptx
- 拉萨市拉萨河(城区段)河道护岸工程汇报材料.pptx
- 统编版2025年春季新版七年级下册历史 第21课 明清时期的科技与文化 教案.docx
- 雅安雨城法院书记员招聘考试真题库2025.docx
- 2026届安徽合肥市高考一模高考语文试卷试题(含答案详解).pdf
- 【专题研究】国内外城市更新研究的最新进展.pdf
- 【专题研究】老旧城区改造居民满意度影响因素研究——以遂宁市老旧城区改造为例.pdf
- 【专题研究】关于旧城空间改造理论与创意设计案例的几点思考.pdf
- 西藏拉萨市高三下学期期末物理备考重点详解.docx
- 泾县法院书记员招聘笔试真题2025.pdf
- 2026年春【苏教版】-六年级数学下册-面积的变化.pptx
- 2026年春【苏教版】-六年级数学下册-7.pptx
最近下载
- 市级课题结题报告-“双减”背景下小学数学课堂开展学生“项目式学习”的实践研究(优秀等次).docx VIP
- 哈露巴露口服液在制备抗肿瘤产品中的应用.pdf VIP
- 铣工工艺学(第五版)习题册马苍平课后习题答案.pdf
- 2025江苏中职职教高考《机电一体化-机械基础》讲义知识考点复习资料.docx VIP
- 2025年拍卖师拍卖场地文化墙与历史回顾区布置专题试卷及解析.pdf VIP
- 民兵化学洗消培训课件.ppt VIP
- 科技内容教学知识(tpack)理论架构对教师专业发展之启示.pdf VIP
- 装饰设计客户需求问卷调查表范本模板.docx VIP
- 民宿概论 课件全套 第1--9章 绪论、民宿市场--- 民宿概论.pptx
- 搅拌站自查报告(共6).docx
原创力文档

文档评论(0)