Llm-Training

Ultrascale Playbook - Context Parallelism

Notes on training LLMs using context parallelism

Notes on training LLMs using tensor and sequence parallelism

Notes on training LLMs using pipeline parallelism

My talk on training LLMs at Pydata MCR

Introduction to collective communication operations used for distributed training.