CourseHunter
  • Категории
    • Искусственный Интеллект logo Искусственный Интеллект
    • Frontend logo Frontend
      • Angular logo Angular
      • HTML logo HTML
      • CSS logo CSS
      • JavaScript logo JavaScript
      • Vue logo Vue
      • jQuery logo jQuery
      • React logo React
      • AngularJS logo AngularJS
      • Backbone logo Backbone
      • TypeScript logo TypeScript
      • Ember logo Ember
      • Next.js logo Next.js
      • Elm logo Elm
      • Svelte logo Svelte
      • Single SPA logo Single SPA
      • Three.js logo Three.js
      • D3.js logo D3.js
      • RxJS logo RxJS
      • WebGL logo WebGL
      • barba.js logo barba.js
    • Backend logo Backend
      • PHP logo PHP
      • Python logo Python
      • Ruby on Rails logo Ruby on Rails
      • Yii logo Yii
      • Laravel logo Laravel
      • SQL logo SQL
      • Ruby logo Ruby
      • Symfony logo Symfony
      • Java logo Java
      • Scala logo Scala
      • Node.js logo Node.js
      • MongoDB logo MongoDB
      • Golang (Google Go) logo Golang (Google Go)
      • Slim logo Slim
      • Silex logo Silex
      • Firebase logo Firebase
      • C Sharp (C#) logo C Sharp (C#)
      • Deno logo Deno
      • Redis logo Redis
      • Django logo Django
      • NestJS logo NestJS
      • Spring logo Spring
      • Spring Boot logo Spring Boot
      • Spring Data logo Spring Data
      • Spring Cloud logo Spring Cloud
      • Spring Security logo Spring Security
      • Spring Integration logo Spring Integration
      • Spring HATEOAS logo Spring HATEOAS
      • Spring MVC logo Spring MVC
      • Elixir logo Elixir
      • Phoenix logo Phoenix
    • System programming logo System programming
      • Rust logo Rust
      • WebAssembly logo WebAssembly
      • C++ logo C++
    • Marketing logo Marketing
      • SEO logo SEO
    • Video and 3D logo Video and 3D
      • Blender logo Blender
      • Cinema 4D logo Cinema 4D
      • ZBrush logo ZBrush
    • Graphic logo Graphic
      • Figma logo Figma
      • Sketch logo Sketch
      • Photoshop logo Photoshop
      • After Effects logo After Effects
      • Illustrator  logo Illustrator
      • Adobe XD logo Adobe XD
      • Lightroom logo Lightroom
      • CorelDRAW logo CorelDRAW
    • DevOps logo DevOps
      • AWS logo AWS
      • Azure logo Azure
      • Docker logo Docker
      • Git logo Git
      • GitHub logo GitHub
      • Gitlab logo Gitlab
      • Google Cloud logo Google Cloud
      • Grafana logo Grafana
      • Kubernetes logo Kubernetes
      • Jenkins logo Jenkins
      • Terraform logo Terraform
      • Другое logo Другое
    • Tools logo Tools
      • GraphQL logo GraphQL
      • Flux logo Flux
      • Webpack logo Webpack
      • Ansible logo Ansible
      • Gulp logo Gulp
      • Grunt logo Grunt
      • Visual Studio Code logo Visual Studio Code
      • VIM logo VIM
      • OpenCV logo OpenCV
      • Salt logo Salt
      • SVN logo SVN
      • Atom logo Atom
      • Elasticsearch logo Elasticsearch
      • Сборки, готовые решения logo Сборки, готовые решения
      • Electron logo Electron
      • Chrome DevTools logo Chrome DevTools
      • Yarn logo Yarn
      • Babel logo Babel
      • Grep logo Grep
      • npm logo npm
      • Vite logo Vite
      • Gatsby logo Gatsby
      • PhpStorm logo PhpStorm
      • Webflow logo Webflow
      • Hibernate logo Hibernate
      • Socket.io logo Socket.io
      • Bash logo Bash
    • Разработка мобильных приложений logo Разработка мобильных приложений
      • React Native logo React Native
      • Ionic logo Ionic
      • Swift logo Swift
      • Progressive Web App (PWA) logo Progressive Web App (PWA)
      • Core Data logo Core Data
      • Xamarin logo Xamarin
      • NativeScript logo NativeScript
      • Dart и Flutter logo Dart и Flutter
    • Gamedev logo Gamedev
      • Unreal Engine logo Unreal Engine
      • Unity logo Unity
    • CMS logo CMS
      • Wordpress logo Wordpress
      • OpenCart logo OpenCart
      • Drupal logo Drupal
      • Joomla logo Joomla
      • 1C-Bitrix logo 1C-Bitrix
      • MODX logo MODX
      • Magento logo Magento
      • Shopify logo Shopify
    • Blockchain logo Blockchain
      • Криптовалюты logo Криптовалюты
      •  Decentralized Applications (dApps) (Web 3) logo Decentralized Applications (dApps) (Web 3)
    • Тестирование logo Тестирование
      • Postman logo Postman
      • Selenium logo Selenium
      • Appium logo Appium
      • Protractor logo Protractor
      • WebdriverIO logo WebdriverIO
      • Cypress logo Cypress
      • Playwright logo Playwright
    • Другое logo Другое
      • Linux logo Linux
      • WebRTC logo WebRTC
      • OpenGL Shading Language (GLSL) logo OpenGL Shading Language (GLSL)
    • Подготовка к собеседованию logo Подготовка к собеседованию
    • Обработка и анализ данных logo Обработка и анализ данных
    • Информационная безопасность logo Информационная безопасность
      • Этический взлом / Тестирование на проникновение logo Этический взлом / Тестирование на проникновение
    • Английский язык logo Английский язык
    • Конференции logo Конференции
  • Источники
  • Все курсы
    • Популярные
    • Бесплатные (2999+ Курсов)
  • Разделы
  • Книги
    • Бесплатные
    • Популярные
  • Краудфандинг logo Краудфандинг
English
Русский
Українська
Голубая
Фиолетовая
Cветлая
Терминал
Norton
Войти
Главная страница Категория обработка и анализ данных Создание большой языковой модели с нуля

Создание большой языковой модели с нуля

Build a Large Language Model (From Scratch)

Sebastian Raschka logo Sebastian Raschka
Создание большой языковой модели с нуля logo Начать Сейчас
Категория
Обработка и анализ данных
Дата добавления
26 янв. 2025 г., 21:32
Язык
Английский
Дата обновления
26 янв. 2025 г., 21:36

«Создание большой языковой модели с нуля» - это практическое руководство, которое шаг за шагом научит вас создавать, обучать и настраивать большие языковые модели (LLMs).

В книге вы пройдете весь путь - от проектирования модели до предобучения на общем корпусе данных и настройки под конкретные задачи. Каждый этап сопровождается понятными объяснениями, диаграммами и примерами.


Чему вы научитесь:

  • Планировать и программировать все части LLM
  • Подготавливать датасеты для обучения модели
  • Тонко настраивать LLM для текстовой классификации и собственных данных
  • Использовать обратную связь для улучшения выполнения инструкций
  • Загружать предварительно обученные веса

Книга проведет вас через внутренние механизмы генеративного ИИ, позволяя не только понять, как работают LLM, но и научиться их адаптировать. Все разработанные примеры можно запускать на обычном ноутбуке.

О технологии

Следуя принципу «я не понимаю ничего, что не могу построить», вы изучите процесс создания GPT-стиля LLM с нуля. Без использования готовых библиотек, вы спроектируете базовую модель, настроите её для классификации текста и в итоге создадите чат-бота, который сможет следовать вашим инструкциям.

О книге

«Создание большой языковой модели с нуля» - это увлекательный практический курс по основам генеративного ИИ. На каждом этапе вы будете углубляться в теорию, подкрепляя знания реальной разработкой, что даст вам глубокое понимание работы и ограничений LLM.

Для кого книга:

Книга подходит читателям с промежуточным уровнем Python и базовыми знаниями машинного обучения. Все разработанные модели будут работать на любом современном ноутбуке, с возможностью использования GPU.

Посмотреть больше

Автор - Sebastian Raschka

Изображение источника Sebastian Raschka

Sebastian Raschka

Я инженер-исследователь в области искусственного интеллекта, специализирующийся на больших языковых моделях (LLMs), глубоком обучении и разработке с открытым исходным кодом. Моя работа включает исследование ИИ, создание практических инструментов и распространение знаний через книги и вклад в проекты с открытым исходным кодом.

Автор
Посмотреть
+3
Категории
Обработка и анализ данных logo

Обработка и анализ данных

Комментарии
User Avatar
Команда внимательно читает ваши комментарии и оперативно на них реагирует. Вы можете спокойно оставлять запросы на обновления или задавать любые вопросы о курсе здесь.

Другие материалы в этой категории

Изображение курса LLM-приложения c Server-Sent Events
newline (ex fullstack.io) logo newline (ex fullstack.io)
23 нояб. 2024 г., 19:38
React.js Python TypeScript

LLM-приложения c Server-Sent Events

Responsive LLM Applications with Server-Sent Events

Крупные языковые модели (LLM) меняют целые индустрии, но их интеграция в пользовательские интерфейсы с потоковой передачей данных в реальном времени сопряжена с уникальными вызовами. На этом курсе вы научитесь без проблем встраивать LLM API в приложения и создавать AI-интерфейсы для потокового текста и чатов с использованием TypeScript, React и Python. Мы шаг за шагом разработаем полнофункциональное AI-приложение с качественным кодом и высокой ги

1 ч 18 мин
Английский
Посмотреть
-1
Изображение курса Создание ИИ-коуча для карьерного роста с использованием открытых LLM
zerotomastery.io logo zerotomastery.io
22 нояб. 2024 г., 23:04
Другое (ИИ)

Создание ИИ-коуча для карьерного роста с использованием открытых LLM

Build an AI Career Coach using an Open Source LLM

Создайте собственного карьерного коуча на базе ИИ, используя открытый LLM и техники управления запросами! Этот коуч сможет обучать, тестировать и мотивировать вас, используя только естественный язык - без необходимости программирования.

1 ч 38 мин
Английский
Посмотреть
+5
Изображение курса Создание интерфейсов для LLM приложений на платформе Streamlit
zerotomastery.io logo zerotomastery.io
23 мая 2024 г., 22:03
Python Другое (Frontend)

Создание интерфейсов для LLM приложений на платформе Streamlit

Developing LLM App Frontends with Streamlit

Этот небольшой курс научит основам Streamlit и тому, как использовать Streamlit для создания фронтенда для ваших приложений на основе LLM.

1 ч 43 мин
Английский
Посмотреть
+4
Изображение курса Буткемп по инженерии запросов (работа с LLM): От нуля до мастерства
zerotomastery.io logo zerotomastery.io
19 мая 2024 г., 21:12
Другое (ИИ)

Буткемп по инженерии запросов (работа с LLM): От нуля до мастерства

Prompt Engineering Bootcamp (Working With LLMs): Zero to Mastery

Перестаньте заучивать случайные запросы. Вместо этого, узнайте, как на самом деле работают крупные языковые модели (LLM), и как эффективно их использовать. Этот курс проведет вас от новичка до мастерства в LLM, обучая вас созданию собственных AI-инструментов, которые выведут вашу карьеру на новый уровень.

27 ч 8 мин
Английский
Посмотреть
+28
Изображение курса ChatGPT и большие языковые модели (LLM): Практическое руководство
zerotomastery.io logo zerotomastery.io
29 мар. 2023 г., 00:09
ChatGPT

ChatGPT и большие языковые модели (LLM): Практическое руководство

ChatGPT & Large Language Models (LLMs): A Practical Guide

Узнайте, как на самом деле работает ChatGPT "под капотом"! Этот компактный курс поможет вам быстро разобраться в больших языковых моделях (LLM), включая такие темы, как проектирование подсказок, настройка и будущее этой захватывающей технологии!

0 ч 58 мин
Английский
Посмотреть
+7

Ресурс видеоуроков программирования для front и back end разработчиков. Бери знания своего профиля у нас, ведь мы самые лучшие блеать. Серьезно.

Категории
Все категории JavaScript React.js Python Java Golang (Google Go) Другое TypeScript Подготовка к собеседованию Rust Конференции
Источники
Все источники ardanlabs.com balun.courses ByteByteGo DesignGurus.io Elliott Minns frontendmasters Matt Pocock udemy zerotomastery.io
Telegram CourseTrain Цена Контакты Распространенные вопросы Плейлисты Приватность Условия
Темы:
Язык: