Table of Contents

并行计算

并行计算

正在进行中的研究：并行计算

GFLOPS的计算

Giga Floating Point Operations Per Second，意思是每秒能够进行多少 十亿次浮点运算

InfiniBand

高性能计算集群中常用的网络连接技术

好像用的不是IP协议？

大致速度：即使是最早期的 SDR (10 Gb/s) 端口，使用 IPoIB 也能到 1 GB/s 左右；常见的 FDR (56 Gb/s) 甚至应在 6 GB/s 以上【AI】

特点	InfiniBand	普通以太网（TCP/IP）
路由	Fabric 内硬件路径，无网关	三层网关（Router），有 NAT
寻址	LID，本地 ID，SM 下管理	IP，需手动配置或 DHCP
延迟	亚微秒	微秒以上
吞吐	最高达 400 Gb/s+	通常 10–400 Gb/s
架构	专用 HPC 网络，扁平、冗余	企业级、互联网广域结构

Overhead

AI：在并行计算（Parallel Computing）中，overhead（开销）指的是为了实现并行而额外增加的时间或资源消耗，这些消耗本身并不直接用于实际的计算任务。可以简单理解为：让多个任务“协作”时，不得不花的“沟通、协调、安排、管理”的额外时间。

任务划分开销：把一个大任务分成很多小任务，这个过程本身就需要消耗一定的时间和资源。
通信开销：多个处理单元（如多个CPU核、多台服务器）在协作时，彼此之间需要交换数据，这种“传话”的时间就是通信开销。
同步开销：并行计算时，有时候任务之间需要等待（比如A等B的数据），这种互相等待就是同步开销。
调度与管理开销：管理任务的分配、收集结果、处理错误等，都属于调度开销。

Out-of-Core GPU Applications

指那些在执行过程中，其数据总量超出了 GPU 显存（memory）容量，但仍然能通过特殊策略在 GPU 上运行的应用程序。

Stencil computation

每个输出元素的值是其“邻域”元素的输入值的函数

通过网络共享算力

一般是公益性质？

BOINC https://boinc.berkeley.edu/ https://github.com/BOINC/boinc
Folding@Home https://foldingathome.org/

Misc

Message Passing Interface，缩写MPI，是一种分布式并行计算中最常用的通信标准
任务并行（Task Parallelism）是一种并行计算范式，强调同时执行多个不同任务，而不是对同一数据执行相同操作（那是数据并行）