4信息分析与服务_201552015742.ppt

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 趋势外推法建立在两个基本假设之上:影响和决定事物过去和现在的发展因素,在未来也基本保持不变;事物的发展属于渐进变化,而不是结构性的突变。 趋势外推法以时间为基本参数,通过归纳分析过去的情况和现在的状况,继而推测预测期内事物未来的发展趋势。 常见的模型:线性模型、指数曲线模型、生长曲线模型、包络曲线模型等。 (五)多元分析法 ——运用数理统计方法来研究解决多指标问题的理论和方法。 回归分析:处理两个或两个以上变量之间依赖关系的一种数学方法。它不仅提供了建立变量之间依赖关系的数学表达式的一般途径,而且通过计算对所建立的经验公式的有效性进行分析,使之能有效地用于预测和控制。 数据采集 样本观察 选择恰当的模型 确定模型参数 回归效果检验 预测和控制 例:已知某年中国各地区城镇居民平均每人全年可支配收入和消费性支出两个变量 ,可用SPSS对数据进行回归分析 。 主成分分析:在降维思想指导下产生的一种有效处理高维数据的方法。在实际问题研究中,往往会涉及众多相关的变量。虽然所涉及的每个变量都提供了一定的信息,但其重要性不同,且在很多情况下,变量间有一定的相关性,从而使得这些变量所提供的信息在一定程度上有所重叠。信息的重叠越大,变量间的相关性也越大。如何对这些变量加以“改造”,用为数较少的、互不相关的、不可直接测量的新变量来反映原变量所提供的绝大部分信息,并通过对新变量的分析达到解决问题的目的,是基于主成分的因子分析法核心思想。 实践中,反映某个问题的可直接测量的变量很多(例如国家信息化测评指标),并且这些变量之间存在相关性。因此,该方法的应用极其广泛。 在分析过程中,选取m(m<p)个主成分,使前m个主成分的累计贡献率达到较高的比例(如80%~90%)。这样,用前m个主成分代替原始变量,不但使变量维数降低,而且也不致于损失原始变量中太多的信息。 聚类分析:聚类是把一组个体按照相似性归成若干个类别,即物以类聚。其目的是使得属于同一类别的个体之间的距离尽可能地小,而不同类别上的个体间的距离尽可能地大。 基本思想:在样品之间定义距离,在变量之间定义相似系数。距离或相似系数代表样品或变量之间的相似程度。 例如,在分层聚类中,按相似程度的大小,将样品或变量逐一归类,关系密切的样品或变量聚集到一个小的分类单位,然后逐步扩大,使得关系疏远的样品或变量聚集到一个大的分类单位,直到所有的样品或变量都聚集完毕,形成一个表示亲疏关系的谱系图,再对谱系图进行分析,并按照要求对样品或变量进行分类。 例:利用SPSS对表中显示的某年度20个代表性地区农村居民家庭平均每人生活消费现金支出情况进行聚类。 谱系图 (六)数据仓库和数据挖掘 数据仓库是“一个面向主题的、集成的随时间变化的非易失性数据的集合,用于支持管理层的决策过程。 数据仓库的特性 面向主题性 支持决策 数据的非易失性 数据的时变性 数据的集合性 数据的集成性 数据仓库的创建、使用都是围绕着主题实现的。 数据随着时间的推移而发生变化。 对分散于各处的源数据进行抽取、筛选、清理、综合。 数据不经常进行更新处理,主要用于查询。 以多维数据库方式进行存储的多维模式。 联机分析处理:一种在线的验证型工具,它建立在多维视图的基础上,根据已有的模式将直接源自数据仓库的不同信息源的大量相关信息联系起来,给分析人员一个清晰、一致的视图。 数据挖掘:一种以预测为目标的挖掘型工具,它建立在各种信息源的基础上,重在发现隐藏在大量原始信息深层次中的对人们有用的模式。被抽取的模式即知识,具备可信、新颖、有效、易于理解的特点,是知识发现的重要途径。 4.4信息分析的内容 (一)科学技术信息分析 例: 我国《国家中长期科学和技术发展规划的制定 要不要制定规划、什么时间制定合 适、怎样制定等问题,以及规划要包括哪些内容等都是在进行了充分研究论证的基础上开展 的。关于规划的内容,科技部根据党中央和国务院的决定,列出20个重大研究专题,分别成立了20个战略研究专题研究组,组织了2000余名来自科技界、社科界、企业界和管理界的专家, 进行重大问题的战略性研究。战略研究成果又通过中国科学院、中国工程院和社会科学院“三 院”进行咨询。在充分调查研究、反复论证的基础上,根据专家对未来世界科技发展态势的研 究预测,以及对我国的具体国情的准确判断制定并发布了《国家中长期科学和技术发展规划(2006- 2020)。 中国科学技术信息研究所为《规划》的制定提供了重要的参考依据。中信所的信息分析人员对我国历次科学技术发展规划进行了系统梳理与研究,同时搜集、翻译并整理了美国、俄罗斯、日本、

您可能关注的文档

文档评论(0)

egip + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档