AI Systems Performance Engineering — это практическое и исчерпывающее руководство по повышению производительности AI-систем на всех уровнях инфраструктуры. В условиях стремительного роста генеративных моделей книга предлагает инженерам, исследователям и разработчикам прикладной набор проверенных стратегий оптимизации, позволяющих совместно настраивать аппаратное обеспечение, программные компоненты и алгоритмы для создания устойчивых, масштабируемых и экономически эффективных решений как для обучения, так и для инференса.
Автор Chris Fregly, инженерный и продуктовый лидер с фокусом на производительность, пошагово показывает, как превращать сложные AI-системы в оптимизированные, высокоэффективные решения. В книге подробно рассматриваются методы тонкой настройки CUDA-ядер на GPU, алгоритмов на базе PyTorch, а также распределённых систем обучения и инференса на нескольких узлах. Особое внимание уделено масштабированию GPU-кластеров, распределённым задачам обучения моделей и высокопроизводительным inference-серверам. Завершает издание подробный чек-лист из более чем 175 готовых к применению оптимизаций.
Книга научит вас совместно проектировать и оптимизировать аппаратное и программное обеспечение для достижения максимальной пропускной способности и снижения затрат, внедрять современные стратегии инференса для уменьшения задержек, использовать ведущие отраслевые инструменты масштабирования, выявлять и устранять узкие места производительности в сложных AI-конвейерах и применять полностековые подходы для обеспечения надёжной и стабильной работы AI-систем.
Chris Fregly — ведущий архитектор решений по генеративному искусственному интеллекту в Amazon Web Services (AWS), работающий в Сан-Франциско, Калифорния. Он является соавтором двух книг издательства O’Reilly: Data Science on AWS и Generative AI on AWS, посвящённых практическому применению машинного обучения и генеративного ИИ в облачной среде AWS.Крис также основал международную серию митапов Generative AI on AWS, объединяющую специалистов по все