CourseHunter
  • Категории
    • Frontend logo Frontend
      • Angular logo Angular
      • HTML logo HTML
      • CSS logo CSS
      • JavaScript logo JavaScript
      • Vue logo Vue
      • jQuery logo jQuery
      • React logo React
      • AngularJS logo AngularJS
      • Backbone logo Backbone
      • TypeScript logo TypeScript
      • Ember logo Ember
      • Next.js logo Next.js
      • Elm logo Elm
      • Svelte logo Svelte
      • Single SPA logo Single SPA
      • Three.js logo Three.js
      • D3.js logo D3.js
      • RxJS logo RxJS
      • WebGL logo WebGL
      • barba.js logo barba.js
    • Backend logo Backend
      • PHP logo PHP
      • Python logo Python
      • Ruby on Rails logo Ruby on Rails
      • Yii logo Yii
      • Laravel logo Laravel
      • SQL logo SQL
      • Ruby logo Ruby
      • Symfony logo Symfony
      • Java logo Java
      • Scala logo Scala
      • Node.js logo Node.js
      • MongoDB logo MongoDB
      • Golang (Google Go) logo Golang (Google Go)
      • Slim logo Slim
      • Silex logo Silex
      • Firebase logo Firebase
      • C Sharp (C#) logo C Sharp (C#)
      • Deno logo Deno
      • Redis logo Redis
      • Django logo Django
      • NestJS logo NestJS
      • Spring logo Spring
      • Spring Boot logo Spring Boot
      • Spring Data logo Spring Data
      • Spring Cloud logo Spring Cloud
      • Spring Security logo Spring Security
      • Spring Integration logo Spring Integration
      • Spring HATEOAS logo Spring HATEOAS
      • Spring MVC logo Spring MVC
      • Elixir logo Elixir
      • Phoenix logo Phoenix
    • System programming logo System programming
      • Rust logo Rust
      • WebAssembly logo WebAssembly
      • C++ logo C++
    • Marketing logo Marketing
      • SEO logo SEO
    • Video and 3D logo Video and 3D
      • Blender logo Blender
      • Cinema 4D logo Cinema 4D
      • ZBrush logo ZBrush
    • Graphic logo Graphic
      • Figma logo Figma
      • Sketch logo Sketch
      • Photoshop logo Photoshop
      • After Effects logo After Effects
      • Illustrator  logo Illustrator
      • Adobe XD logo Adobe XD
      • Lightroom logo Lightroom
      • CorelDRAW logo CorelDRAW
    • DevOps logo DevOps
      • AWS logo AWS
      • Azure logo Azure
      • Docker logo Docker
      • Git logo Git
      • GitHub logo GitHub
      • Gitlab logo Gitlab
      • Google Cloud logo Google Cloud
      • Grafana logo Grafana
      • Kubernetes logo Kubernetes
      • Jenkins logo Jenkins
      • Terraform logo Terraform
      • Другое logo Другое
    • Tools logo Tools
      • GraphQL logo GraphQL
      • Flux logo Flux
      • Webpack logo Webpack
      • Ansible logo Ansible
      • Gulp logo Gulp
      • Grunt logo Grunt
      • Visual Studio Code logo Visual Studio Code
      • VIM logo VIM
      • OpenCV logo OpenCV
      • Salt logo Salt
      • SVN logo SVN
      • Atom logo Atom
      • Elasticsearch logo Elasticsearch
      • Сборки, готовые решения logo Сборки, готовые решения
      • Electron logo Electron
      • Chrome DevTools logo Chrome DevTools
      • Yarn logo Yarn
      • Babel logo Babel
      • Grep logo Grep
      • npm logo npm
      • Vite logo Vite
      • Gatsby logo Gatsby
      • PhpStorm logo PhpStorm
      • Webflow logo Webflow
      • Hibernate logo Hibernate
      • Socket.io logo Socket.io
      • Bash logo Bash
    • Разработка мобильных приложений logo Разработка мобильных приложений
      • React Native logo React Native
      • Ionic logo Ionic
      • Swift logo Swift
      • Progressive Web App (PWA) logo Progressive Web App (PWA)
      • Core Data logo Core Data
      • Xamarin logo Xamarin
      • NativeScript logo NativeScript
      • Dart и Flutter logo Dart и Flutter
    • Gamedev logo Gamedev
      • Unreal Engine logo Unreal Engine
      • Unity logo Unity
    • CMS logo CMS
      • Wordpress logo Wordpress
      • OpenCart logo OpenCart
      • Drupal logo Drupal
      • Joomla logo Joomla
      • 1C-Bitrix logo 1C-Bitrix
      • MODX logo MODX
      • Magento logo Magento
      • Shopify logo Shopify
    • Blockchain logo Blockchain
      • Криптовалюты logo Криптовалюты
      •  Decentralized Applications (dApps) (Web 3) logo Decentralized Applications (dApps) (Web 3)
    • Тестирование logo Тестирование
      • Postman logo Postman
      • Selenium logo Selenium
      • Appium logo Appium
      • Protractor logo Protractor
      • WebdriverIO logo WebdriverIO
      • Cypress logo Cypress
      • Playwright logo Playwright
    • Другое logo Другое
      • Linux logo Linux
      • WebRTC logo WebRTC
      • OpenGL Shading Language (GLSL) logo OpenGL Shading Language (GLSL)
    • Подготовка к собеседованию logo Подготовка к собеседованию
    • Обработка и анализ данных logo Обработка и анализ данных
    • Информационная безопасность logo Информационная безопасность
      • Этический взлом / Тестирование на проникновение logo Этический взлом / Тестирование на проникновение
    • Английский язык logo Английский язык
    • Конференции logo Конференции
  • Источники
  • Все курсы
    • Популярные
    • Бесплатные (100+ Курсов)
  • Разделы
  • Книги
    • Бесплатные
    • Популярные
  • Краудфандинг logo Краудфандинг
🇺🇸 English
🇷🇺 Русский
🇺🇦 Українська
Голубая
Фиолетовая
Cветлая
Терминал
Norton
Войти
Главная страница Категория обработка и анализ данных Создание большой языковой модели с нуля

Создание большой языковой модели с нуля

Build a Large Language Model (From Scratch)

Sebastian Raschka logo Sebastian Raschka
Создание большой языковой модели с нуля logo Начать Сейчас
Категория
Обработка и анализ данных
Дата добавления
26.01.2025
Язык
Английский
Дата обновления
26.01.2025

«Создание большой языковой модели с нуля» - это практическое руководство, которое шаг за шагом научит вас создавать, обучать и настраивать большие языковые модели (LLMs).

В книге вы пройдете весь путь - от проектирования модели до предобучения на общем корпусе данных и настройки под конкретные задачи. Каждый этап сопровождается понятными объяснениями, диаграммами и примерами.


Чему вы научитесь:

  • Планировать и программировать все части LLM
  • Подготавливать датасеты для обучения модели
  • Тонко настраивать LLM для текстовой классификации и собственных данных
  • Использовать обратную связь для улучшения выполнения инструкций
  • Загружать предварительно обученные веса

Книга проведет вас через внутренние механизмы генеративного ИИ, позволяя не только понять, как работают LLM, но и научиться их адаптировать. Все разработанные примеры можно запускать на обычном ноутбуке.

О технологии

Следуя принципу «я не понимаю ничего, что не могу построить», вы изучите процесс создания GPT-стиля LLM с нуля. Без использования готовых библиотек, вы спроектируете базовую модель, настроите её для классификации текста и в итоге создадите чат-бота, который сможет следовать вашим инструкциям.

О книге

«Создание большой языковой модели с нуля» - это увлекательный практический курс по основам генеративного ИИ. На каждом этапе вы будете углубляться в теорию, подкрепляя знания реальной разработкой, что даст вам глубокое понимание работы и ограничений LLM.

Для кого книга:

Книга подходит читателям с промежуточным уровнем Python и базовыми знаниями машинного обучения. Все разработанные модели будут работать на любом современном ноутбуке, с возможностью использования GPU.

Посмотреть больше

Авторы Build a Large Language Model (From Scratch)

Изображение источника Sebastian Raschka

Sebastian Raschka

Я инженер-исследователь в области искусственного интеллекта, специализирующийся на больших языковых моделях (LLMs), глубоком обучении и разработке с открытым исходным кодом. Моя работа включает исследование ИИ, создание практических инструментов и распространение знаний через книги и вклад в проекты с открытым исходным кодом.

Автор
Посмотреть
Категории
Обработка и анализ данных logo
Обработка и анализ данных
Комментарии
User Avatar
Команда внимательно читает ваши комментарии и оперативно на них реагирует. Вы можете спокойно оставлять запросы на обновления или задавать любые вопросы о курсе здесь.

Другие материалы в этой категории

Изображение курса LLM-приложения c Server-Sent Events
fullstack.io logo fullstack.io
23.11.2024
React.js Python TypeScript

LLM-приложения c Server-Sent Events

Responsive LLM Applications with Server-Sent Events

Крупные языковые модели (LLM) меняют целые индустрии, но их интеграция в пользовательские интерфейсы с потоковой передачей данных в реальном времени сопряжена с уникальными вызовами. На этом курсе вы научитесь без проблем встраивать LLM API в приложения и создавать AI-интерфейсы для потокового текста и чатов с использованием TypeScript, React и Python. Мы шаг за шагом разработаем полнофункциональное AI-приложение с качественным кодом и высокой ги

1 ч 18 мин
Английский
Посмотреть
-2
Изображение курса Создание ИИ-коуча для карьерного роста с использованием открытых LLM
zerotomastery.io logo zerotomastery.io
22.11.2024
Другое (ИИ)

Создание ИИ-коуча для карьерного роста с использованием открытых LLM

Build an AI Career Coach using an Open Source LLM

Создайте собственного карьерного коуча на базе ИИ, используя открытый LLM и техники управления запросами! Этот коуч сможет обучать, тестировать и мотивировать вас, используя только естественный язык - без необходимости программирования.

1 ч 38 мин
Английский
Посмотреть
+5
Изображение курса Создание интерфейсов для LLM приложений на платформе Streamlit
zerotomastery.io logo zerotomastery.io
23.05.2024
Python Другое (Frontend)

Создание интерфейсов для LLM приложений на платформе Streamlit

Developing LLM App Frontends with Streamlit

Этот небольшой курс научит основам Streamlit и тому, как использовать Streamlit для создания фронтенда для ваших приложений на основе LLM.

1 ч 43 мин
Английский
Посмотреть
+4
Изображение курса Буткемп по инженерии запросов (работа с LLM): От нуля до мастерства
zerotomastery.io logo zerotomastery.io
19.05.2024
Другое (ИИ)

Буткемп по инженерии запросов (работа с LLM): От нуля до мастерства

Prompt Engineering Bootcamp (Working With LLMs): Zero to Mastery

Перестаньте заучивать случайные запросы. Вместо этого, узнайте, как на самом деле работают крупные языковые модели (LLM), и как эффективно их использовать. Этот курс проведет вас от новичка до мастерства в LLM, обучая вас созданию собственных AI-инструментов, которые выведут вашу карьеру на новый уровень.

27 ч 8 мин
Английский
Посмотреть
+25
Изображение курса ChatGPT и большие языковые модели (LLM): Практическое руководство
zerotomastery.io logo zerotomastery.io
29.03.2023
ChatGPT

ChatGPT и большие языковые модели (LLM): Практическое руководство

ChatGPT & Large Language Models (LLMs): A Practical Guide

Узнайте, как на самом деле работает ChatGPT "под капотом"! Этот компактный курс поможет вам быстро разобраться в больших языковых моделях (LLM), включая такие темы, как проектирование подсказок, настройка и будущее этой захватывающей технологии!

0 ч 58 мин
Английский
Посмотреть
+7

Ресурс видеоуроков программирования для front и back end разработчиков. Бери знания своего профиля у нас, ведь мы самые лучшие блеать. Серьезно.

Категории
Все категории JavaScript React.js Python Java Golang (Google Go) Другое TypeScript Подготовка к собеседованию Другое (Frontend) Другое (ИИ)
Источники
Все источники Academind Pro Alex Chiou Aurimas Griciūnas balun.courses frontendmasters Santiago Valdarrama udemy zerotomastery.io Дмитрий Холстинин
Telegram CourseTrain Цена Контакты Распространенные вопросы Плейлисты Приватность Условия
Темы:
Язык: