- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库下基于知识库的虚拟实验平台构建
数据仓库下基于知识库的虚拟实验平台构建
引言 虚拟实验室主要是一种为了模拟现实实验的一个分布式的,基于网络的分布式,可以提供在线教学,技术交流,共同研究,实时交流的一个信息平台。目前虚拟实验室的定义大致分为两种,一种是基于计算机创建的虚拟平台,实验者可以通过平台可以在里面实现预设实验,形成最后的分析结果。另一种是创造一个交互环境作为引导模拟实验的场所。然而不论是哪种定义,总的来说。虚拟实验室是一种为了替换现有实验方式,扩展实验实现条件的。节约实验成本的一种新型实验教学方式。虚拟实验室主要由模拟部分,数据分析部分构成。现行的虚拟实验室一般分为三大类:基于网络应用云计算技术,基于虚拟现实,多人协作虚拟实验室。对于虚拟实验室的改进一般是在技术上的更新。现在虚拟实验室还具有一个最严重的的缺点,可扩展性不足,只能针对某个领域实现,并且实现出来的实验室不具有学习分析功能,例如胡文成在基于网络平台虚拟实验室技术的研究和实现一文中提出的基于C/S的虚拟实验室实验内容的还不够丰富,在仿真环境的逼真程度上,还需要有进一步的改进。张小平在基于EDA虚拟实验室中心值法的研究一文中只是针对于单机进行试验。结合现在大数据的技术在此基础上提出数据仓库下基于知识库的虚拟实验平台构建设想。 1总体架构 为了克服现在虚拟实验室通用性低、构建成本高,学生创新性难以得到拓展这个问题。基于现在数据仓库,云计算的背景下。使用人工智能技术构建一个能提高学生动手能力,培养学生创造才能的虚拟实验平台是一件具有极大意义的工作。 曾雪辉在虚拟实验室中用户注册组件的设计与实现一文中提出了组件的概念。 虚拟实验室核心采用应用服务器集群进行运算处理,使用B/S架构。实现瘦客户端运行,从而提高软件平台运行兼容性。使用javaee技术开发,项目实现部分开源,从而提升项目的可维护性以及可拓展性。虚拟实验在核心仿真模块的支撑下,采用组件技术分离实验场景,实验组件。使用XML配置耦合模块,不仅从软件开发的角度实现了复用,同时为创新实验室,研发实验室提供可靠的组件。 虚拟实验室的主要功能还是不能摆脱为用户提供真实互动的实验功能。虚拟实验室在构建初期主要是为用户实现普通实验的模拟。该虚拟实验的构建值得指出的一点是,改实验室不同于市面上的专注于一种或者一类实验。这是一个实验平台,实验平台构建之后,主要会为一定用户提供开源服务,一些具有初步编程知识或者想融合到开发中的人员就会慢慢丰富平台实验。在实验提供以后测试之后就会在平台分权限开放。从而支撑一部分实验模拟练习。 在普通实验的支撑下,用户可以任意组织实验。最初使用专家打分等方法实现对于实验数据的分析以及分析。在数据积累到一定数量的时候采用机器学习的方式从数据仓库中进行挖掘与学习,从而形成规则库,在规则库的反馈下机器就能不断的成长同时呈现出相对精准的结果。这样的话无论对于用户兴趣探索还是科研初期雏形都是有意义的。 传统数据生成之后,经过分类之后会存人数据数据仓库。创新实验经过分类之后也会存人数据仓库。这里的数据库不局限于现在的分布式数据库。也包含分布式数据库,同时数据库磁盘也会使用阵列进行支撑。从而从物理上保证数据的完整性。 数据仓库内被打上标签的数据会用挖掘工具进行训练,形成规则库。规则库内规则反作用于实验。形成了有效闭环。 该虚拟实验室主要是基于规则学习的知识库反馈组合平台,实验室建设主要分为模块匹配库以及实验知识库。在此基础上通过应用服务器集群为外界提供普通实验室,创新实验室以及研发实验室接口。通过这三个接口为外界提供服务。其中普通实验室主要是整合那些可以在实验室完成普通实验,创新实验室主要是通过规则库以及构件库的支撑对外提供跨学科以及跨领域的组合实验。研发实验室是一个服务于少数具备一定业务知识以及编程人员的接口,这个实验室可以对外提供一些自己研发以及构建的实验。 实验数据主要分为两类,一类是传统实验数据,这类数据主要是针对普通实验而言的。这类实验数据具有一定区间标准,可以通过编程实现分析,从而将分析结果展现给用户。同时将数据进行检验留底,从而为后面分析留下依据。另一类是自己组合实验产生的数据,这类数据是一些新兴数据,以及不可预计的结果,这类结果可以提供给那些致力于创新??验的用户,一方面用于数据分析。另一方面可以提供给实验专家,作为打破实验创新瓶颈的参考。最后将数据进行标识以及分类放入实验知识库。 知识库通过智能算法分析组合产生规则。此类规则主要用于反馈实验组合,为自主实验者提供原始数据。从而指导创新。 知识库还可以作为后面分析的数据仓库实现对于实验规律的探究。由于数据是不规则的,可以考虑使用mongodb等非结构化数据库存储。 2数据仓库数据流转 数据是构成实验平台的关键所在,由
文档评论(0)