Llm | Blog

Ultrascale Playbook - Pipeline Parallelism

Notes on training LLMs using pipeline parallelism

My talk on training LLMs at Pydata MCR

Notes on choosing appropriate batch size and compute for training LLMs

Notes on training LLMs using sharding strategies

Notes on training LLMs using data parallelism strategy