«Создание большой языковой модели с нуля» - это практическое руководство, которое шаг за шагом научит вас создавать, обучать и настраивать большие языковые модели (LLMs).
В книге вы пройдете весь путь - от проектирования модели до предобучения на общем корпусе данных и настройки под конкретные задачи. Каждый этап сопровождается понятными объяснениями, диаграммами и примерами.
Чему вы научитесь:
Планировать и программировать все части LLM
Подготавливать датасеты для обучения модели
Тонко настраивать LLM для текстовой классификации и собственных данных
Использовать обратную связь для улучшения выполнения инструкций
Загружать предварительно обученные веса
Книга проведет вас через внутренние механизмы генеративного ИИ, позволяя не только понять, как работают LLM, но и научиться их адаптировать. Все разработанные примеры можно запускать на обычном ноутбуке.
О технологии
Следуя принципу «я не понимаю ничего, что не могу построить», вы изучите процесс создания GPT-стиля LLM с нуля. Без использования готовых библиотек, вы спроектируете базовую модель, настроите её для классификации текста и в итоге создадите чат-бота, который сможет следовать вашим инструкциям.
О книге
«Создание большой языковой модели с нуля» - это увлекательный практический курс по основам генеративного ИИ. На каждом этапе вы будете углубляться в теорию, подкрепляя знания реальной разработкой, что даст вам глубокое понимание работы и ограничений LLM.
Для кого книга:
Книга подходит читателям с промежуточным уровнем Python и базовыми знаниями машинного обучения. Все разработанные модели будут работать на любом современном ноутбуке, с возможностью использования GPU.
Я инженер-исследователь в области искусственного интеллекта, специализирующийся на больших языковых моделях (LLMs), глубоком обучении и разработке с открытым исходным кодом. Моя работа включает исследование ИИ, создание практических инструментов и распространение знаний через книги и вклад в проекты с открытым исходным кодом.