基于大数据存储区域自动筛选数据库优化.docVIP

下载本文档

5
0
约2.79千字
约 6页
2017-06-10 发布于福建
举报
版权申诉

基于大数据存储区域自动筛选数据库优化.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于大数据存储区域自动筛选数据库优化

基于大数据存储区域自动筛选数据库优化　　摘要：提出一种基于大数据存储区域自动筛选的数据库优化存储和访问技术，首先进行数据库中数据分布存储模型设计和数据结构分析，采用模糊C均值聚类算法进行大数据的存储区域优化聚类，提高数据聚敛能力。采用滤波算法进行数据库中的干扰滤波处理，对滤波输出的数据进行存储区域的自动筛选控制，实现数据库存储空间优化，提高数据库访问的指向性和配准性。仿真结果表明，利用该方法进行数据库优化设计，对大数据的存储和调度性能都有较大改善关键词关键词：大数据存储；数据库优化；聚类；滤波 DOIDOI：10.11907/rjdk.161795 中图分类号：TP392 文献标识码：A 文章编号：1672-7800（2016）008-0165-03 0 引言近年来，随着大数据处理技术的快速发展，对大数据的存储和调度成为大数据信息处理的关键。随着人们对分布式数据库的逐步关注、深入研究与常态化应用，采用分布式级联数据库进行大数据存储成为大数据处理应用的重要方向。研究大数据的分布式级联数据库优化设计，将在云存储和大数据智能信息处理等领域具有较高的应用价值[1] 通过对数据库存储结构和数据访问技术的优化设计，提高数据库对大数据的存储和调度控制能力。传统的数据库存储采用堆栈列表控制方法进行大数据存储，随着存储量和干扰的增大，导致数据库的调度和访问准确性不高。在数据库访问中，目前主要有基于语义信息特征提取的数据库访问技术、基于词频特征分布的数据库访问技术和基于关键字的数据库访问技术等[2，3]。其中，文献[4]提出一种基于语义数据集特征提取的数据库优化设计方法，以实现数据库的优化存储和大数据处理。首先找出两个最不相关的语义数据集合，考查词频准确性和样本记录数量之间的关系，通过有向图模型设计方法，提高数据库的调度和访问指向性能力。但是该方法计算开销较大，收敛性不好[5]。针对上述问题，本文提出一种基于大数据存储区域自动筛选的数据库优化存储和访问技术，首先进行数据库中数据分布存储模型设计和数据结构分析，采用模糊C均值聚类算法进行大数据的存储区域优化聚类，提高数据聚敛能力。采用滤波算法进行数据库中的干扰滤波处理，对滤波输出的数据进行存储区域的自动筛选控制，实现数据库存储空间优化，提高?稻菘夥梦实闹赶蛐院团渥夹浴Ｗ詈笸ü?仿真实验进行了性能测试，得出有效性结论，展示了较高的应用价值 1 预备知识及数据库中大数据存储数据结构分析 1.1 数据库中数据分布存储模型设计为了实现对大型网络级联数据库的优化设计和存储访问控制，首先采用分布式存储调度方法，对大型网络级联数据库的存储数据采集结构进行存储数据的数据结构分析，再用有向图表示云计算环境下大型网络级联数据库的数据分布存储模型，如图1所示，以此为基础进行数据的存储结构优化设计[6] 1.2 数据结构分析与信息流时间序列分析在上述构建了数据库中数据分布存储模型的基础上，为了实现对数据存储区域的自动筛选和访问控制，进行数据库结构和数据信息流时间序列分析及信号模型构建。求大型网络级联数据库存储数据每类样本的模糊神经网络控制的隶属度函数，先求得隶属度函数的特征采样均值Ej=∑FijKj（i∈Kj，j=1，2，…，N），Kj为第j类样本符合K个分配因子的带宽，并抽取数据库访问特征序列的相空间模糊度点集作为数据库访问控制训练集的聚类中心S，取其最大值si作为资源带宽差值控制的第一个聚类中心，采用自适应波束形成进行特征采样和资源访问控制，假设访问控制函数为：在数据库访问过程中，假设时间函数为一个非线性的时间序列，得到数据库访问过程的不确定干扰项为：其中，U为数据库访问控制中的特征采样数据论域。这里采用粒子群算法进行数据库的访问时间序列分析，粒子群在搜索过程中经常会陷入局部最优解，采用混沌映射方法，带领粒子逃离局部最优解，混沌映射的状态空间更新迭代过程为：依据混沌映射搜索的最小积分准则，当粒子群在搜索过程中簇的中心点收敛到数据库的资源聚类中心时，求得数据库的资源聚类训练集的功率谱密度函数作为特征，进行特征提取和时间序列分析，得到数据的特征向量为：通过上述处理，实现对大型数据库数据结构和信息流时间序列的分析，为实现数据库的优化设计奠定基础 2 大数据存储区域自动筛选及数据库优化在上述进行了数据结构分析和信息流时间序列分析的基础上，进行数据库优化设计改进。提出一种基于大数据存储区域自动筛选的数据库优化存储和访问技术，采用模糊C均值聚类算法进行大数据的存储区域优化聚类，提高数据聚敛能力。模糊C均值聚类算法的实现过程如下，对大型网络级联数据库存储数据的结构特征优选的C均值聚类中心为：通过上述算法改进