转载

[期刊]使用确定随机Petri网对Hadoop公平调度的建模和性能分析

使用确定随机Petri网对Hadoop公平调度的建模和性能分析

何华 林闯 赵增华 庞善臣

由于Hadoop能在同一时间处理多个用户提交的不同作业的多个任务,这使得用传统的方法对其进行建模和性能分析变得十分困难。为了解决这个问题,基于马尔可夫排队模型M/MMDP/C/K建立了一个随机Petri网(SPN)模型和一个确定随机Petri网(DSPN)模型来分别描述Hadoop调度中的数据状态和作业公平调度。通过设置DSPN中的使动谓词和随机开关来建模Hadoop公平调度和YARN公平调度。使用嵌入的马尔可夫链模型来分析单用户情景,而在分析多用户情景时则引入分解和迭代技术来减小模型的状态空间,从而避免产生状态爆炸问题。研究侧重于Hadoop中作业调度的平均性能,仅通过求解提出的分析模型,就可以对比和分析服务质量(Qo S)的一些关键指标,如平均吞吐量、平均队列长度和平均时延。采用Matlab进行仿真:当每秒到达任务数大于等于20时,YARN算法的数据积压和平均时延明显少于公平算法;当每秒到达任务数大于等于30时,YARN算法的平均吞吐量明显高于公平算法。实验结果表明,YARN公平算法能够减少平均处理和排队等待时间,在平均吞吐量、平均队列长度和平均时延上明显优于公平算法。

使用确定随机Petri网对Hadoop公平调度的建模和性能分析

正文到此结束
Loading...