Nathan Lambert

Натан Ламберт — руководитель направления post-training в Институте искусственного интеллекта Аллена. Ранее он работал в HuggingFace, DeepMind и Facebook AI. Натан выступал приглашённым лектором в Стэнфорде, Гарварде, MIT и других ведущих университетах, а также является постоянным и востребованным докладчиком на NeurIPS и других конференциях по искусственному интеллекту. Он удостоен ряда профессиональных наград, включая «Best Theme Paper Award» на ACL и «Geekwire Innovation of the Year». На его научные работы в области ИИ приходится более 8 000 цитирований в Google Scholar, а его статьи о современных исследованиях ИИ на популярной платформе interconnects.ai ежегодно набирают миллионы просмотров. Натан получил степень PhD по электротехнике и компьютерным наукам в Калифорнийском университете в Беркли.

Курсы от Nathan Lambert

Изображение курса RLHF и пост-тренинг LLM

Nathan Lambert

27 нояб. 2025 г., 00:45

Другое (ИИ)

RLHF и пост-тренинг LLM

The RLHF Book. Reinforcement learning from human feedback, alignment, and post-training LLMs

Курс предлагает глубоко структурированное и практико-ориентированное погружение в методы выравнивания больших языковых моделей с помощью человеческой обратной связи. Материал помогает понять как теоретические основы RLHF, так и реальные инженерные пайплайны, применяемые в индустрии для создания современных LLM.О чём этот курсКурс основан на книге Натана Ламберта и объединяет философские идеи, экономику ИИ, фундаментальные алгоритмы RL и соврем