本篇文章目录导航:
【题目】探究云存储系统的云数据放置优化方法??
【第一章】面向云存储系统的云数据放置方法研究绪论
【第二章】云存储及其相关技术
【第三章】云数据多目标存储模型
【第四章】基于多目标遗传算法的云数据放置策略
【第五章】云数据放置实验与分析
【第六章】云数据放置优化方法的结论与参考文献
第五章 实验与分析
本章将通过计算机实验仿真来验证本文所提出的基于多目标遗传算法的云数据安全放置策略的效率。
5.1实验方案
5.1.1 评估参数
为了对本文所提出的基于多目标遗传算法的云数据安全放置策略可用性和有效性进行系统化的评估,本文件采用检索时间、数据节点的利用率、安全水平三个评估标准来对其进行衡量,具体为:
(1)检索时间:对于检索一个文件操作的总检索时间(所有数据块传输到查询节点的时间)除以数据块数求平均值。
(2)数据节点利用率:数据放置策略中存在对于 N 个数据块的选取。在多个文件存入时,查看 M 个数据节点中实际被使用的节点占比(最小为 N/M)。
(3)安全水平:根据本文对于安全水平的定义,计算出当前文件存储的安全水平。
5.1.2 算法比对
为对比分析实验的结果,本实验参考文献[56]中的方法对数据节点的选择策略进行了设计,该策略用以从M个数据节点中选出符合整体安全水平的N个节点存入N个数据块。其思想是设定一个节点集,初始包括随机选择的一个数据节点,根据不同的选择策略选出一个节点插入当前节点集并确保节点集中两两节点间的安全水平不低于最小安全阈值,且平均安全水平不低于平均安全阈值。以下为两种节点选择策略:
(1)随机选取节点(Random Selection of Nodes,RSN):按照节点选择策略随机选择包含N个节点的节点集。
(2)最远节点优先(Furthest Node First,FNF):
选择离当前节点集中节点平均距离最远的并且符合节点选择策略的包含N个节点的节点集。
5.2 实验与分析
5.2.1 实验环境
将云存储系统中M个数据节点及其网络环境抽象成一个拓扑网络。数据节点的存储容量随机设定为[10,15]GB;网络中数据节点之间的带宽随机设定为[200,500]Mbps之间,并由此构成网络链路的带宽矩阵。
本文实验部分采用JAVA语言,在Eclipse开发平台上进行JAVA程序编写,程序编写的方法具体参照本文多目标遗传算法中对于染色体编码、选择、交叉、变异等操作的设计。如图5.1所示,程序读取输入的网络拓扑文件、数据大小、数据块数以及安全阈值,执行算法后获得如图5.2所示的结果,包括相应节点集、存入数据后的数据安全水平以及检索时间。
5.2.2 实验结果
(1)仿真实验一验证、比较了本文所提出的基于多目标遗传算法的云数据安全放置方法中存入数据的量对数据检索时间、数据节点利用率以及安全水平的影响程度。该部分仿真试验中,数据节点为100个,原始数据被切分为数据块的数量为10.
图5.3试验中设定每个数据大小为0.1G.实验分八次,每次存入100个原始数据,然后计算100个原始数据检索的平均用时。该实验可以看出GA算法在检索效率上明显优于RSN和FNF,并且GA和FNF相较于RSN有着更好的稳定性。
图5.4描述了随着存储原始数据量的增加,数据节点的利用率的变化情况。可以看出,存入原始数据量的增加,GA和RSN的数据节点利用率显着提高,表现为数据的分散程度比较高,即原始数据切分后的数据块是分散存储在了存储系统中的,印证了系统的安全性,同时保证了存储系统的负载均衡。
图5.5描述了随着存储原始数据量的增加,数据安全性的变化情况。该实验设定存入原始数据大小为1G.如图所示,随着原始数据量的增加,部分存储节点出现满载情况,导致可选节点集变小,从而影响数据的安全水平。图中可以看出GA算法在安全性能方面具有最好的稳定性。
(2)仿真实验二验证、比较了不同的安全水平、数据节点数、数据块数量下,检索时间的变化情况,该部分实验每个原始数据的大小为0.1G.
图5.6描述了安全水平要求变化对于检索时间的影响。该实验设定数据节点数为100,数据块数为10,实验结果显示出随着安全性能要求的提高,GA算法的检索时间增加,这是由于安全性能的提高直接增大了存放个数据块节点之间的距离,所以检索路径长度增加。
图5.7描述了数据节点的变化对于检索时间的影响。该实验设定数据块为10个,结果显示出随着数据节点数的增加检索时间呈现增加的态势,这是由于在更大的网络拓扑下,存储数据块的各节点间物理距离的增大所造成的。其中GA的增长最慢,表现最好;FNF增长最快,表现最差。
图5.8描述了原始数据切分数据块数的变化对于检索时间的影响。该实验设定数据节点为200个,结果显示出随着数据块数量的增加,三种算法的检索时间均减小。当数据块数增长到一定时,三种算法检索时间相近,这是由于数据块数变大导致这些数据块均匀的分布在拓扑的每一个部分所造成的。可以预见的是,在数据块数与数据节点数相差越大时,GA算法的优越性就越好。而这一实验同样体现出了GA较其他两种算法具有更好的稳定性。
5.3本章小结
该节通过进行多次仿真实验,将不同的参数设为变参,均显示出GA算法在检索的时间开销上优于于RSN和FNF算法。同时在安全性能方面,GA算法具有更好的稳定性,并且安全水平在遗传算法中作为变参,可以通过调整增大算法的安全水平阈值,保证每一次数据存储的安全水平大于该阈值,从而达到实际的需求。