大学代写论文网专业提供代写毕业论文、代写本科论文服务
您现在的位置:首页 > 计算机论文 > 软件工程论文 >
云数据多目标存储模型
发布时间:2019-10-15

  本篇文章目录导航:

  【题目】探究云存储系统的云数据放置优化方法??
  【第一章】面向云存储系统的云数据放置方法研究绪论
  【第二章】云存储及其相关技术
  【第三章】云数据多目标存储模型
  【第四章】基于多目标遗传算法的云数据放置策略
  【第五章】云数据放置实验与分析
  【第六章】云数据放置优化方法的结论与参考文献

第三章 云数据多目标存储模型

  本章主要基于前文研究的云存储系统中的云数据分布式存储模式,提出了一种云存储模型。该模型将云数据的存储过程定义为一个多目标优化问题,核心内容是为云数据选择适当的数据节点进行数据存储,优化了云存储系统的安全性能以及检索效率。

  3.1问题定义

  当前,对于云数据安全的研究主要集中在应对网络层攻击和对数据本身进行安全性处理两个方面[49-50].本文着重探讨对于数据进行安全处理的数据放置方法。其中对于数据安全处理的研究主要集中在数据加密技术。

  Liu J K在对云存储系统的数据安全保护机制[51]的研究中提出了一种方法,即服务端仅提供加密数据而无法解密数据的功能,用户则需要两个媒介才能解密文件,一个是解密密钥,另外一个是连接电脑的个人安全设备,只有同时具有两项才能解密。余琦在基于HDFS分布式存储的安全技术研究中提出了一种复合型加密方法[52],首先对存入HDFS的文件进行AES加密,然后再用RSA算法保障AES密钥安全。而一些云存储供应商比如Amazon S3和Google Cloud Platform提供了服务器端加密服务,根据安全级别用不同长度的密钥加密用户数据。薛矛等人提出了一个基于云存储系统之上添加了一层安全系统架构Corslet,同时采用安全证书对于用户的身份验证来保护数据的安全性[53].综上,对于加密算法或者是安全架构的应用无疑在数据检索方面增加了计算的步骤,从而加大了时间开销,影响了检索效率。

  同时对于优化数据安全和检索效率的研究也相对成熟。黄永峰等人在其对于云存储系统安全性和检索效率的研究中提出了采用全同态加密法的查询模型,首先计算查询出的数据与目标数据之间的相关性,统计查询的词频和倒排的目标数据频率,再采用全同态加密策略对数据加密建立索引目录,最后将加密后的文件以及索引信息打包上传到后台[54].在M.Tu的安全数据的最优化放置方法中[55],也同时解决了优化检索和数据安全的问题,但以上研究中仍然采用加密的方式保护数据,从而存在额外的开销。

  Seungmin Kang在IEEE网络会议中提出了一种全新的云存储数据放置策略[56].在不使用加密的方式保护数据的前提下同时优化了检索速度。其思想是对隐私文件进行拆分为多个存储,而不同的数据块存放在不同的节点中,并且这些节点不会直接连接,保证了如果某一节点被入侵的情况下不会得到整个文件的有效信息,并且攻击者无法猜出剩下的数据块存在哪一位置。其实现是将数据放置问题作为一个最小化检索时间的线性规划模型,并由节点的容量、节点间的带宽以及节点间的距离作为约束条件,以达到在保证数据安全的同时得到一个检索最优解。但其所采用的T-coloring算法在节点选取上不够灵活,且所选取的节点集并非最优解,尤其是在大型复杂的网络环境中效率偏低。

  基于上述研究中的成果和不足,并且结合了云存储系统中存在的云数据安全威胁以及云数据分布式存储中存在的复杂网络所造成数据传输效率低的问题,本文将云数据的安全性能和检索效率作为两个优化目标,提出了一种多目标优化的云存储模型。该存储模型是将原始文件切割为多个小文件,然后将这些文件存入分布式的存储节点之中。并且定义数据相关性这一参数来表示这些文件之间的相关性,相关性高的两个文件需要存放在距离较远的两个节点中,以保证当其中一个文件所在节点被黑客攻击时,与其相关性高的文件由于距离远的原因不易被攻击。这样可以保证黑客无法获得相关性高的整个文件,而单个文件碎片没有具体的意义。该模型不仅抛弃了传统的加密方法,提高了文件的存储和传输效率,同时在节点选取上进行了平衡,保证数据安全的前提下优化了文件传输路径,提高了检索效率。

软件工程

  3.2多目标优化问题

  在实际的工程问题中,尤其是在网络模型问题中,我们经常要处理的数学模型不止有一个目标函数,而是有多个目标函数,是一个多目标优化问题[57].例如,在信息网络模型中,目标函数不仅要求信息通信的成本最小化,而且要求延迟时间的最小化。在生产与物流系统中,通常将生产和配送的成本或时间最小而总利润最大的多目标数学模型作为最优化模型。

  在这样的多目标优化模型中,各目标函数经常是相互冲突的,无法同时满足。由此,其解搜索空间变得更复杂,难以确定获得最优解的搜索方向。

  多目标优化问题用文字表达为决策变量参数、目标函数以及约束条件所组成的优化问题,其中决策变量与目标函数、约束条件之间存在函数关系。

  带有m个约束条件的单目标优化问题数学模型通常可以表示成如下形式:

  3.3存储模型

  由于本模型中数据是采用分布式的方式将原始数据切分为多个数据块存放在不同的数据节点当中的,当系统的某个或者某些数据节点被恶意攻击以后,黑客无法猜出整体数据中所有的敏感信息。因此,对于恶意攻击者而言,单个数据节点的敏感信息是没有具体意义的,除非绝大部分包含有敏感信息的数据块被存放在了链路关系比较密切的几个数据节点当中。

  例如,数据节点被存放在了相邻的数据节点当中,黑客可以很容易地通过逐项遍历的方式检索到其他的敏感信息。另外一方面,如果为了保证数据的安全性,将切分后的数据块放置的位置过于偏远,从而会增加用户正常的数据检索时间。本文所要解决的问题便是在保证即使在某个单一数据节点被黑客攻击的前提下,也无法猜测出其他的数据数据节点的具体位置。

  并且在此基础上需要满足最小化数据的检索时间。

  保障数据存放安全的前提下最小化数据检索时间,首先是要保障所存储数据的安全性。

  因此,本文中我们引入一种分布式相关性来定义系统的安全水平。具体为当原始数据被切分成多个数据块放置在不同的数据节点当中后,各存放有数据块的数据节点中可能会包含有原始数据中的部分敏感信息。此时,存放在各数据节点中的数据块之间可能存在有相关度比较高的特征。

  可以根据数据节点中数据所含有特征信息来描述相关数据节点之间的相关性。本文中我们定义两个数据节点Si和Sj之间的相关性为其Pearson相关系数[58]:

  性越小。从数据存储的角度来说,为保证数据存储的安全,当敏感数据块iD 和jD 之间的相关性越大,如果两个数据块存放在了两个逻辑距离比较近的数据节点中时,若其中一个数据节点被恶意攻击后,黑客获取另外一个数据节点中的数据块信息的概率将会大大增高。因此,在该种情况下,设计数据的放置策略时应该尽量考虑将两个相关性较高的数据块存放在逻辑距离较远的两个数据节点当中。由此,我们可以定义本文系统中数据节点Si和Sj之间的安全水平为:

  3.4约束多目标优化模型

  本文所要解决的根本问题是在保障存储数据安全的前提下最小化用户对数据的检索时间。实际上,该问题是一个多目标优化问题(Multi-objective Optimization Problem,MOP),包括最小化数据的检索时间T以及最大化系统的安全水平W.因此,结合式(3.11)和式(3.12)中的定义,可以得到系统在保证数据安全前提下最小化检索时间的目标函数为:

  约束(3.15)表示的是所有数据块的尺寸总和是等于原始数据的尺寸的;约束(3.16)表示的是存放在数据节点Sn处数据块的尺寸是小于数据节点Sn的最大容量Cn的。

  通过以上最优化的模型在一个分布式的存储系统中获取最优化的数据放置策略是一个NP难题,传统的数值计算方法往往不能有效计算其全局最优解。对于此类问题,我们将采取约束优化问题的方法进行求解。约束优化问题(constrained optimization problems,COPs)是指在一系列参数的约束条件下,针对问题求出最优化目标的问题,是一种比较难以求解的问题。

  目前,求解约束优化问题的算法可以分为:确定性算法和不确定性算法[60].确定算法包括投影梯度法、填充函数法、惩罚函数法、序列二次规划法等,这些方法的求解大多依赖函数的初始值以及梯度信息,对于最优解的收敛较慢,易陷入局部最优解,且对于连通性差,不可导以及没有函数表达式的问题没有很好的解决方法。不确定算法不依赖问题本身的严格数学性质在解决全局最优解的问题中比较有优势。运行时间相对较短且描述简单,容易实现。不确定算法主要是一些启发式算法[61]

  包括模拟退火法、蚁群算法、遗传算法等。本文在下一章将重点研究遗传算法。

  3.5本章小结

  本章为了解决云存储环境中云数据的安全性能和检索效率的要求,基于云存储系统的分布式存储结构,提出了一种多目标优化的云数据存储模型。该模型考虑了分布式存储的网络拓扑结构,包括节点存储容量、带宽大小、传输最短路径,根据这几种参数进行了数学建模,并提出多目标函数进行求解。该模型对文件进行分割处理并将相关性高的文件块进行分散存储,达到云数据的安全要求,并且求出最短路径,提高检索效率。本章提出的模型目前只考虑了网络存储拓扑中的部分参数,但在云存储系统中的真正运用时,仍需要考虑更多的复杂情况,例如计算成本、硬件成本、网络时延以及负载均衡[62]

  以及并行任务等因素。所以仍然需要进行更加深入的研究优化该模型,实现云存储系统的实际应用。

对应分类:
版权所有:大学论文网专业权威的论文代写、论文发表的网站,秉承信誉至上、用户为首的服务理念,服务好每一位客户
本站部分论文收集于网络,如有不慎侵犯您的权益,请您及时致电或写信告知,我们将第一时间处理,邮箱:82274534@qq.com