基于性能建模的深度学习训练任务调度综述

2024-06-22 320 2.61M 0

  近年来,深度学习研究成果在全球范围内得到广泛应用.为了提高大规模深度学习模型的训练效率,业界通常采用建设GPU集群并配置高效的任务调度器的策略.然而,深度学习训练任务具有性能异构性和放置拓扑敏感性等复杂性能特性.对性能无感知的调度容易导致资源利用率低下、训练效率差等问题.为了应对这一挑战,近期涌现出大量基于性能建模的深度学习训练任务调度器.这些调度器通过构建精确的性能模型,深入了解任务的复杂性能特性,并据此设计更优化的调度算法,从而形成更高效的调度方案.本文首先基于建模设计思路,对目前调度器使用的性能建模方法进行分类综述.随后,根据调度器利用性能建模的调度优化途径,对现有的任务调度工作进行了系统性的分析.最后,对性能建模与调度在未来的研究方向进行了展望.



您还没有登录,请登录后查看详情

331/1000专辑:论文下载

举报收藏 0打赏 0评论 0
相关资源
本类推荐
下载排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  RSS订阅  |  蜀ICP备19012879号