浅述粒度计算模型.docVIP

下载本文档

9
0
约2.89千字
约 7页
2018-11-23 发布于福建
举报
版权申诉

浅述粒度计算模型.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

浅述粒度计算模型

浅述粒度计算模型　　摘要：近年来，人们开始将粒度计算应用到数据挖掘领域中，并初步取得了一些成果，成为当前数据挖掘领域一个新的研究方向。本文研究了模型中的粒度计算，浅谈了几类粒度计算模型。　　关键词：数据挖掘粒度计算粒度计算模　　一、粒度计算的起源　　1979年，美国数学家Zadeh在模糊集合论的基础上，首次提出并讨论了模糊信息粒化问题，推动了模糊逻辑理论及其应用的发展，但当时未引起普遍的重视。1985年，Hobbs提出一种粒度理论，在人工智能中将一个表示待求解的整体问题的逻辑公式用粒度理论方法分解成若干个小问题或子公式，然后分别对这些子公式求解并最后合并成整体公式的解。Hobbs在文中提出的这个模型实质上是把较大的整体粒度拆成较小的局部粒度，反过来又从较小的粒度合并成整体粒度解，但该文只是提出了这个模型的假设，并没有给出粒度计算的规则，只是用谓词或函数项定义了粒度和划分粒度。 T. Y. Lin等人于1997年正式提出粒度计算概念，随后，在短短的几年里，人们在各个不同的角度中广泛研究粒度计算，但更多的还是从模糊集和粗糙集方面入手，目前粒度计算都是和这些学科结合起来，没独立成形。　　二、粒度计算模型　　1.粒度计算定义　　L. A.Zadeh 提出了人类认知的三个基本概念：粒化（granulation）、组织（organization）和因果（causation）。粒化指将整体分解为部分，组织指从部分合并为整体，因果指原因和结果的关联。他进一步指出粒度计算是信息处理的一种新的概念和计算范式，覆盖了所有有关粒度的理论、方法、技术和工具的研究。粗略地讲，一方面它是模糊信息粒度理论、粗糙集理论、商空间理论、区间计算等的超集，另一方面是粒度数学的子集。具体地讲，凡是在分析问题和求解问题中应用了分组、分类和聚类手段的一切理论与方法均属于粒度计算的范畴。　　2.粒度计算的基本问题　　粒度计算主要涉及两个方面的问题：粒的构造和利用粒作为对象的运算、推理。对于其中的每个问题都可以从语义和算法两个方面来进行研究。　　粒的构造涉及粒的形成、表示。在集合理论中，一个粒可以被理解为一个子集，在词计算理论中，将语句作为一个模糊粒。　　一个粒的构造可以采用自顶向下（top-down）的分解形成，也可以自底向上（button-up）的合成。分解或合成到什么地步以达到所需的粒度，一般来说是基于相互之间的关系来确定是不是应该合成或分解，有时也会借助于语义或领域知识的帮助。　　具体说来，粒的构造包含以下三个方面的内容：　　（1）构造粒的标准、准则。准则是用来确定、规定为什么不同的对象需要放到同一粒中，准则必须信息粒化的结果对问题的本质有更深入的理解。　　（2）构造粒的方法。构造粒或者信息粒化的方法是从算法角度来考虑，也就是回答如何将不同的对象放到同一个粒中。　　（3）粒的表示及描述。一旦粒化结束，也即粒已经构造好了，必须使用某种语言去描述它。可以给不同层次的粒度标上标记，也可以用数学公式形式化地描述它，也可以用粒中的中心点来表示，或者可以通过描述不同粒度的范围来区分不同的粒度。　　（4）定性、定量分析。通过对粒的定性、定量分析，可以提取必要的规则。　　3.粒度计算模型　　目前有关粒度计算的理论与方法，主要有三个。一是Zadeh的“词计算理论”（Theory of Works Computing），二是Z.Pawlak 的“粗糙集理论”（Theory of Rough Set），三是国内的张钹院士和张铃教授提出的“商空间理论”（Theory of Quotient Space）。　　（1）词计算理论　　Zadeh认为人类在进行思考、判断、推理时主要是用语言进行的，而语言是一个很粗的“粒度”，如我们说“九寨沟的风景很美”，其中州良美”这个词就比较“笼统”，也就是说其粒度很粗，如何利用语言进行推理判断，这就是要进行“词计算”，早在二十世纪六十年代Zadeh提出模糊集理论，就是“词计算”的雏型。沿Zadeh的模糊集论的方向，用模糊数学的方法进行有关粒度计算的方法和理论的研究，就构成“粒度计算”的一个非常重要的方法和方向。这也是人们比较熟悉的一个方法。　　（2）粗糙集理论　　知识的含糊性包括：①语言的模糊性，如大小、多少;②数据的不完整性，如噪声、干扰;③知识本身的粗糙性，如规则的前后间的依赖关系不确定性等。　　波兰学者Z.Pawlak在1982年首先提出了粗糙集理论，它不仅能够在缺少关于数据的先验知识的情况下，仅仅以观测数据的分类能力为基础，解决模糊或不确定性数据的分析和处理，而且算法简单，易于理解。粗糙集理论把知识看成是对有关对象论域的划分，而等价关系