Этот курс поможет вам с нуля разобраться, как на самом деле работают reasoning-модели, через практические и увлекательные занятия. Вы заглянете «за кулисы» одного из крупнейших прорывов в области искусственного интеллекта и поймёте, как такие модели «рассуждают», как их обучают с помощью обучения с подкреплением и почему за их логикой могут скрываться неожиданные ограничения, искажения и даже «секреты».
Reasoning-модели стали важной вехой в развитии ИИ: они используют своего рода «черновик» (scratchpad) для пошагового вывода, приближаясь к тому, что в когнитивной науке называют мышлением Системы 2 — более медленным, аналитическим и последовательным. На первый взгляд их работа кажется магией. Этот курс снимает иллюзию магии и объясняет, что происходит «под капотом», чтобы вы понимали, как и когда применять такие модели, почему они работают и в каком направлении развивается технология.
Вы начнёте с фундаментальных принципов, а затем быстро перейдёте к анализу реального поведения моделей. Через практические упражнения вы исследуете, как формируется цепочка рассуждений, как модели обрабатывают сложные задачи и где возникают сбои.
Далее вы разберёте механизмы обучения: обучение с подкреплением (reinforcement learning), RLHF, процессные reward-модели, датасет PRM800K, а также влияние современных scaling laws и концепции test-time compute на будущее ИИ.
Отдельный блок посвящён более сложной и интригующей теме — ситуациям, когда reasoning-модели вводят в заблуждение, демонстрируют стратегическое поведение или скрывают внутреннюю логику вывода. Вы научитесь распознавать такие случаи и критически оценивать результаты их «мышления».
Посмотреть больше
Это пробный урок. Оформите подписку, чтобы получить доступ ко всем материалам курса. Премиум
Ограничение времени просмотра
Вы можете просматривать пробный урок только 10 минут. Получите полный доступ, чтобы смотреть без ограничений.
Независимо от того, начинаете ли вы изучать программирование или хотите усовершенствовать свои навыки, Академия Zero To Mastery научит вас React, Javascript, Python, CSS и многим другим вещам, чтобы помочь вам продвинуться по карьерной лестнице, получить работу и добиться успеха в некоторых ведущих компаниях.