Table of Contents

Multi‑GPU work sharing in a task‑based dataflow programming model


一些记录

AI:PaRSEC(Parallel Runtime Scheduling and Execution Controller)是来自田纳西大学创新计算实验室(ICL)的一个任务型数据流运行时框架,设计用于在分布式、多核异构系统上高效调度微任务并管理数据依赖关系。https://icl.utk.edu/parsec/

AI总结

研究背景与问题

当下高性能计算节点通常包含多个GPU,但使用传统的共享内存或消息传递范式编写高效的多GPU程序仍然十分复杂 。 任务驱动的数据流编程模型(如 PaRSEC)提供了一种替代方案,但多数运行时只在初始阶段进行任务映射,一旦映射完成,即便负载出现不平衡也不会动态调整。

创新与贡献

实验与结果

总结

这篇文章通过在任务驱动的数据流框架中引入动态任务共享,解决了多 GPU 环境下负载分配不均的问题。其核心价值在于: