基于关联规则的养老满意度分析.docVIP

下载本文档

4
0
约2.98千字
约 6页
2018-11-27 发布于湖北
举报
版权申诉

基于关联规则的养老满意度分析.doc

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于关联规则的养老满意度分析　　摘要：基于河北省农村老年人养老满意度进行问卷调查和实地调研，利用关联规则挖掘技术分析河北省农村养老满意度的影响因素及它们的影响程度，为进一步提高河北省农村老年人养老满意度提供参考。在关联规则挖掘中发现，参加农村合作医疗，有村集体补贴，职业为务农的老年人的养老满意度较高；与子女同住老年人的养老满意度较高；未参加农村合作医疗，职业为非务农的老年人养老满意度较低。　　关键词：养老满意度；GRI算法；关联规则　　中图分类号：F840 文献标志码：A 文章编号：1673-291X（2014）10-0049-03 　　引言　　1999年以来，中国正式步入老龄化国家的行列，人口老龄化问题是中国经济社会发展面临的重大现实问题之一。人口基数大、发展迅速、“未富先老”等是中国老龄化的特点。养老问题是关系国计民生的大事，关系到人民的切身利益，特别是在中国经济发展相对落后的农村，社会养老保障制度不完善、农民收入水平低下，大量劳动力外流，使得在对老年人生活照料、精神慰藉和疾病护理等方面得不到保障，因此，探讨农村老年人养老满意度的影响因素，进而提高农村老年人的养老满意度尤其重要。本文在研究大量资料、参考论文相关实践成果的基础上，以“中国老龄事业发展‘十二五’规划”为指导，在调查研究的基础上，对调查数据进行预处理和统计分析，通过关联规则技术分析河北省农村老年人养老满意度的影响因素。　　一、关联规则的基本思想　　关联分析的目的是找出数据库中隐藏的关联网，寻找事物之间的联系规律和结构特征，挖掘它们之间的关联关系。数据挖掘中，关联分析的主要技术是关联规则，最早由Agrawal、Imielinski和Swami提出。关联规则挖掘是为了寻找同一事件中不同项之间的相关性。简单关联规则是数据挖掘的主要工具之一，属于无监督学习方法，能够揭示数据中隐含的关联特征。　　Clementine提供了Apriori、Carma和GRI等经典算法。本文用的是GRI算法，算法是由Smyth和Goodman于1992年提出的，是在ITRule算法的基础上拓展形成的，可用于简单的关联分析。GRI算法的主要特点是：不但能够处理分类型变量，而且前项还可以为数值型变量；数据只能按事实表方式存储；采用深度优先搜索策略实现算法。　　二、养老满意度中关联规则的应用　　（一）数据准备　　从调查数据的频数分析中，我们发现部分变量的在取某值的频数很低，甚至有的变量取值的频数为0，为了后续更好的分析，利用Clementine对变量进行筛选。软件操作实现过程。其中设定的条件为：变量中缺失值所占比例大于70%；分类变量中类别值所占比例大于90%；分类变量的类别个数占总样本的比例大于95%的应视为不重要变量。指定总体满意度为输出变量，其他变量为输入变量。1-概率p值越高，说明输入变量与输出变量的相关性越强，输入变量越重要。　　（二）变量前后项设定　　在建立关联规则模型之前，首先设定模型的变量前后项，职业、经济来源、居住状况、娱乐活动、社会活动、村集体补贴和农村合作医疗等变量均为有限个值，且各值之间无序，因此定义成标称类型；年龄、月平均收入、文化水平、低保制度和总体满意度各变量值之间具有一个隐含的序，因此定义成连续型数值类型；同时指定总体满意度为关联规则的后件，其余为关联规则的前件。　　（三）基于GRI算法的关联规则建模　　根据上述的数据预处理的方法对调查数据进行整理，预处理后的数据和筛选出来的变量建立GRI模型实现挖掘过程。　　1.设定阀值　　规则的支持度和置信度大于用户设置的最小支持度和置信度的阈值时才是一条有效规则。所以在关联规则挖掘中需要合理、自行设置最小支持度和置信度的阈值。因为这些阀值的大小直接决定关联规则挖掘结果中规则的数量。如果支持度阀值太小，会生成大量的规则，并且会失去代表性，挖掘出的规则毫无意义。而如果支持度阀值设置太大，则可能无法找到阀值要求的规则。但是在软件操作过程中并没有明确的依据确定如何设置模型的最小支持度阈值和置信度阈值，所以本文在实际操作中，采用设置不同最小支持度阈值的方式进行反复挖掘，即进行若干次探索性的挖掘。我们在反复挖掘中最终选择分析在最小支持度阈值为7%，最小置信度阈值为55%的情况下进行关联规则挖掘。　　2.关联规则结果分析　　因为只有在提升度大于1的时候才有意义，所以本文从提升度大于1的关联规则中按照最小支持度进行排序，支持度大于7%的条件下，选取部分置信度大于55%的排名靠前且有代表性的规则，规则进行论述，选出的规则。　　后项{总体满意度=1}的关联规则。规则1说明职业是务农且参见农村合作医疗的老年人，养老满意度较高，其概率为55.6%；规则2说明和子女同住，