«Большие языковые модели в production» — практическое и прикладное руководство для специалистов, которые хотят научиться выводить решения на базе LLM из стадии прототипа в надежные production‑системы. Обновленное содержание, акцент на реальных кейсах и подробные разборы технологий делают книгу ценным источником знаний для инженеров и команд, работающих с генеративным ИИ.
О чём эта книга
Издание помогает понять ключевые концепции больших языковых моделей и научиться применять их в реальных продуктах. Авторы объясняют, как устроены LLM, как они обучаются и какие особенности нужно учитывать при интеграции моделей в существующие технологические ландшафты.
Основные темы
архитектура и обучение LLM;
сравнение готовых моделей и собственных разработок;
масштабирование ML-платформ под задачи генеративного ИИ;
тонкая настройка и дообучение моделей (PEFT, LoRA, RLHF);
deployment в облаке и на edge‑устройствах;
MLOps и LLMOps для корпоративных решений.
Практические проекты
Книга не ограничивается теорией — читатель получает возможность применить знания на практике.
Вы познакомитесь с тремя реальными проектами
Создание и обучение собственной LLM с разбором этапов подготовки данных и выбора архитектуры.
Разработка AI-расширения для VSCode с использованием современных инструментов генеративного ИИ.
Запуск компактной модели на Raspberry Pi и оптимизация для ограниченных вычислительных ресурсов.
Современные тенденции и технологии
Авторы освещают актуальные направления развития генеративного ИИ, которые уже сегодня применяются в индустрии.
В книге рассматриваются
RAG-системы и работа с внешними источниками данных;
knowledge graphs и управление корпоративными знаниями;
увеличение контекстных окон и новые подходы к обработке длинных запросов;
инструментальные агенты и взаимодействие LLM с внешними сервисами;
регулирование ИИ и его влияние на разработку продуктов.
Для кого предназначена книга
Издание будет особенно полезно data scientists, ML-инженерам и техническим специалистам, знакомым с Python и базовыми принципами облачного deployment. Книга помогает перейти от экспериментов к созданию полноценных, устойчивых и масштабируемых production‑решений на базе LLM.
Кристофер Бруссо — ведущий инженер по машинному обучению (Staff MLE) в JPMorganChase, специалист на стыке ИИ, лингвистики и локализации. Кристофер специализируется на обработке естественного языка (NLP) с опорой на лингвистические методы, уделяя особое внимание международным проектам. За его плечами — успешный опыт руководства инициативами в сфере ML и продуктов данных как в динамичных стартапах, так и в компаниях из списка Fortune 500.
Мэтт Шарп — инженер, бывший дата-сайентист и опытный технологический лидер в сфере MLOps. Он успешно руководил множеством data-проектов как в стартапах, так и в ведущих технологических компаниях. Специализируется на внедрении, управлении и масштабировании моделей машинного обучения в production-среде вне зависимости от её сложности и специфики.