Ансамбль методов: ускорение, пакетирование, начальная загрузка и статистическое машинное обучение для Data Science в Python
В последние годы мы наблюдали возрождение ИИ, искусственного интеллекта и машинного обучения.
Машинное обучение привело к некоторым удивительным результатам, таким как способность анализировать медицинские изображения и предсказывать заболевания наравне с человеческими экспертами.
Программа Google AlphaGo смогла победить чемпиона мира в стратегической игре, используя глубокое обучение.
Машинное обучение даже используется для программирования автомобилей с самостоятельным вождением, что навсегда изменит автомобильную индустрию. Вообразите мир с резко уменьшенными автомобильными авариями, просто удаляя элемент человеческой ошибки.
Известно, что Google объявил, что теперь они «сначала изучают машины», и такие компании, как NVIDIA и Amazon, последовали его примеру, и это то, что будет стимулировать инновации в ближайшие годы.
Машинное обучение встроено во все виды различных продуктов и используется во многих отраслях, таких как финансы, интернет-реклама, медицина и робототехника.
Это широко применяемый инструмент, который принесет вам пользу независимо от того, в какой отрасли вы работаете, а также откроет массу возможностей для карьерного роста, когда вы станете успешным.
Машинное обучение также поднимает некоторые философские вопросы. Мы строим машину, которая может думать? Что значит быть сознательным? Будут ли компьютеры когда-нибудь захватывать мир?
Этот курс посвящен ансамблевым методам.
Мы уже изучили некоторые классические модели машинного обучения, такие как k-ближайший сосед и дерево решений. Мы изучили их ограничения и недостатки.
Но что, если бы мы могли объединить эти модели, чтобы устранить эти ограничения и создать гораздо более мощный классификатор или регрессор?
В этом курсе вы изучите способы объединения моделей, таких как деревья решений и логистическая регрессия, для создания моделей, которые могут достичь гораздо более высокой точности, чем базовые модели, из которых они сделаны.
В частности, мы подробно изучим алгоритмы Random Forest и AdaBoost.
Чтобы мотивировать нашу дискуссию, мы узнаем о важной теме в статистическом обучении, компромиссе между отклонениями. Затем мы изучим методику начальной загрузки и пакетирование как методы уменьшения как смещения, так и дисперсии одновременно.
Мы проведем множество экспериментов и будем использовать эти алгоритмы на реальных наборах данных, чтобы вы могли из первых рук увидеть, насколько они мощные.
Поскольку глубокое обучение сегодня очень популярно, мы изучим некоторые интересные общие черты между случайными лесами, AdaBoost и нейронными сетями глубокого обучения.
Все материалы для этого курса бесплатны. Вы можете загрузить и установить Python, Numpy и Scipy с помощью простых команд в Windows, Linux или Mac.
Этот курс фокусируется на «как построить и понять», а не просто «как использовать». Любой может научиться использовать API через 15 минут после прочтения некоторой документации. Речь идет не о «запоминании фактов», а о «наблюдении за собой» с помощью экспериментов. Он научит вас, как визуализировать то, что происходит внутри модели. Если вы хотите больше, чем просто поверхностный взгляд на модели машинного обучения, этот курс для вас.