English
Русский
Українська
Голубая
Фиолетовая
Cветлая
Терминал
Norton
Войти
☀️ Планы на лето: прокачать ИИ, CS-базу и забрать оффер со скидкой 50% по промокоду— активируйна странице пакетов

От Тьюринга до ChatGPT: 10 научных статей, которые создали современный мир и искусственный интеллект

От Тьюринга до ChatGPT: 10 научных статей, которые создали современный мир и искусственный интеллект

Сегодня технологии развиваются с ошеломляющей скоростью: вчерашние студенты пишут import torch в файлах Python и получают миллиардные чеки от венчурных инвесторов. Однако за этим успехом стоит столетняя цепная реакция научных открытий, совершенных выдающимися учеными.

Давайте разберем 10 самых важных научных работ в истории компьютерных наук, которые шаг за шагом вели человечество к созданию искусственного интеллекта.

1. Рождение алгоритма и машины (1936)

  • Автор: Алан Тьюринг
  • Статья: «On Computable Numbers, with an Application to the Entscheidungsproblem»

В 1930-х годах великий математик Давид Гильберт задал фундаментальный вопрос: существует ли универсальный алгоритм, способный определить истинность любого математического утверждения? (Так называемая «Проблема разрешения»).

Алан Тьюринг дал жестокий ответ: нет, такого алгоритма не существует. Но чтобы доказать это математически, ему пришлось сначала объяснить миру, что вообще такое «алгоритм». Он описал гипотетическое устройство с бесконечной лентой, считывающей головкой и таблицей правил. Эта «Машина Тьюринга» стала абстрактным чертежом для каждого компьютера, смартфона и сервера, существующих сегодня.

В этой же работе Тьюринг доказал невозможность решения «проблемы остановки» (нельзя написать программу, которая со 100% вероятностью предскажет, зависнет ли любая другая программа или завершит работу), зафиксировав пределы возможностей вычислений.

2. Изобретение «бита» и теории информации (1948)

  • Автор: Клод Шеннон
  • Статья: «A Mathematical Theory of Communication»

Спустя 12 лет Клод Шеннон совершил революцию, полностью отделив смысл человеческих сообщений от их математической структуры. В его теории фразы «Я люблю тебя» и «Кот горит» несут одинаковый объем информации, если они одинаково неожиданны для получателя.

Шеннон свел всю информацию к универсальной единице измерения — биту (потоку единиц и нулей). Чтобы рассчитывать неопределенность и передачу данных, он заимствовал термин из термодинамики — энтропию. Чтобы измерить энтропию английского языка, Шеннон заставлял людей угадывать следующую букву в предложении. По иронии судьбы, именно этим — предсказанием следующего токена — сегодня занимаются все большие языковые модели (LLM). Неудивительно, что создатели ИИ-модели Claude (компания Anthropic) назвали свой продукт именно в честь Клода Шеннона.

3. Первая попытка скопировать мозг (1958)

  • Автор: Фрэнк Розенблатт
  • Статья: «The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain»

Психолог (а не программист) Фрэнк Розенблатт вдохновился структурой человеческого мозга и создал перцептрон — базовое устройство, которое принимает входные сигналы, умножает их на «веса» и корректирует эти веса, когда совершает ошибку.

Это был прообраз первой нейросети. Хайп в прессе был колоссальным: Военно-морские силы США спонсировали проект, а The New York Times писала, что компьютеры вот-вот обретут сознание.

4. Первый крах ИИ и «Зима» (1969)

  • Авторы: Марвин Минский и Сеймур Пейперт
  • Книга/Статья: «Perceptrons: An Introduction to Computational Geometry»

Эйфория длилась недолго. Двое ученых из MIT опубликовали математическое опровержение возможностей перцептрона. Они доказали, что однослойный перцептрон не способен решить даже простейшую логическую задачу XOR (исключающее «ИЛИ» — когда истинно либо А, либо Б, но не оба сразу).

Эта работа стала смертным приговором для ИИ того времени. Финансирование испарилось, и наступила первая «Зима ИИ». В мелком шрифте авторы упомянули, что если объединить перцептроны в многослойные структуры, проблема XOR исчезнет. Однако в 1969 году никто в мире не знал, как обучать такие многослойные системы.

5. Порядок в хаосе распределенных систем (1978)

  • Автор: Лесли Лампорт
  • Статья: «Time, Clocks, and the Ordering of Events in a Distributed System»

Пока нейросети находились в забвении, компьютеры начали объединяться в сети. Лампорт осознал фундаментальную проблему: у независимых компьютеров нет общего «абсолютного времени». Как заставить тысячи машин согласовать порядок событий?

Лампорт предложил отказаться от физических часов и перейти на логические часы (отношение «случилось прежде» или happened-before), основанные на причинно-следственной связи. Если событие А породило событие Б, значит, А было раньше. Эта концепция стала фундаментом для всех современных баз данных, блокчейна и, что критически важно, кластеров для обучения ИИ, где тысячи видеокарт (GPU) должны работать синхронно, не превращая вычисления в хаос.

6. Метод обратного распространения ошибки (1986)

  • Авторы: Дэвид Румельхарт, Джеффри Хинтон, Рональд Уильямс
  • Статья: «Learning representations by back-propagating errors»

Спустя 17 лет после начала «зимы ИИ» группа ученых, включая «крестного отца ИИ» Джеффри Хинтона, нашла ответ на вопрос, как обучать многослойные нейросети. Решением стал алгоритм обратного распространения ошибки (Backpropagation).

Суть проста: данные пропускаются вперед (forward pass), измеряется величина ошибки на выходе, а затем эта ошибка «проталкивается» обратно по слоям с помощью производных и формул исчисления. Веса корректируются так, чтобы сеть ошибалась чуть меньше. Нейросеть начала обучаться сама, а ее скрытые внутренние слои стали самостоятельно распознавать контуры, формы и концепты, которые в них никто вручную не закладывал. Однако в 1986 году метод работал плохо — катастрофически не хватало вычислительной мощности и данных.

7. Создание главного массива данных (1998)

  • Авторы: Ларри Пейдж и Сергей Брин
  • Статья: «The Anatomy of a Large-Scale Hypertextual Web Search Engine»

С развитием интернета возникла необходимость в его структурировании. Создатели Google предложили алгоритм PageRank. Вместо того чтобы просто считать частоту слов на странице, алгоритм стал воспринимать каждую ссылку как «голос». Чем авторитетнее сайт, который на тебя ссылается, тем весомее его голос.

Построив прототип в своей комнате в общежитии, Брин и Пейдж создали поисковый гигант. Но для индустрии ИИ важнее другое: этот алгоритм помог собрать и упорядочить самый гигантский массив человеческих текстов в истории — будущую «кормовую базу» для обучения нейросетей.

8. ИИ заговорил в полный голос: AlexNet (2012)

  • Авторы: Алекс Крижевский, Илья Суцкевер, Джеффри Хинтон
  • Статья: «ImageNet Classification with Deep Convolutional Neural Networks»

В 2012 году три фактора наконец сошлись вместе: алгоритм обратного распространения ошибки, огромный массив размеченных фотографий (ImageNet) и вычислительная мощность игровых видеокарт от Nvidia.

Аспирант Алекс Крижевский собрал глубокую сверточную нейросеть (AlexNet) буквально у себя в спальне и выставил ее на ежегодный конкурс по распознаванию изображений. В то время как другие команды годами боролись за доли процента эффективности, AlexNet обрушила показатель ошибок сразу на 10% за один год. Это шокировало научное сообщество и доказало: Глубокое обучение (Deep Learning) работает, ему просто нужно больше данных и вычислительной мощности.

9. Архитектура, изменившая всё: Трансформер (2017)

  • Авторы: Ашиш Васвани и др. (Google Brain)
  • Статья: «Attention Is All You Need»

До 2017 года языковые модели читали текст последовательно — слово за словом. Из-за этого к концу длинного предложения нейросеть напрочь забывала, что было в начале.

Google представил архитектуру Transformer (Трансформер), которая полностью отказалась от последовательного чтения. Механизм «внимания» (Attention) позволил модели оценивать взаимосвязь всех слов в тексте одновременно. Это не только сделало нейросети «умнее», но и позволило параллельно масштабировать вычисления на огромных кластерах. Google совершил историческую ошибку, выложив эту архитектуру в открытый доступ — именно буква Т в названии ChatGPT означает «Трансформер».

10. Сила масштаба и рождение ChatGPT (2020)

  • Авторы: Команда OpenAI
  • Статья: «Language Models are Few-Shot Learners»

В 2020 году компания OpenAI решила пойти самым прямолинейным путем: они взяли архитектуру Трансформер и масштабировали ее до безумных 175 миллиардов параметров, скормив модели практически весь текстовый интернет. Так появилась модель GPT-3.

Их безумная ставка заключалась в том, что «интеллект» — это не какой-то секретный скрытый алгоритм, а свойство, которое эмерджентно (само по себе) возникает при переходе количества в качество. GPT-3 внезапно научилась переводить тексты, писать программный код и резюмировать статьи, хотя ее этому целенаправленно не учили. Спустя два года эта технология превратилась в ChatGPT, запустив текущий глобальный бум искусственного интеллекта.

Итог: 100 лет ИТ-истории в одном абзаце

Если свести весь вековой путь к простому резюме, то:

  • Алан Тьюринг определил, что такое вычислительная машина.
  • Клод Шеннон дал этой машине язык и валюту (биты).
  • Фрэнк Розенблатт подарил ей первый аналог нейрона.
  • Джеффри Хинтон научил эти нейроны эффективно учиться.
  • Google обеспечил архитектуру и собрал данные.
  • OpenAI просто выкрутили ручку масштаба на максимум.

Каждая из этих статей — это ступень колоссальной лестницы, по которой человечество поднялось от создания первых реле до генеративного разума.

На основе I read every major CS paper of the last 100 years...

Читайте также

Комментарии
 logo