Главная страница Категория другое (ии) Создание локальной системы RAG на основе LlamaIndex и Ollama

Создание локальной системы RAG на основе LlamaIndex и Ollama

Name: Создание локальной системы RAG на основе LlamaIndex и Ollama
Price: 13 USD
Rating: 5 (4 reviews)

GenAI RAG with LlamaIndex, Ollama and Elasticsearch

Andreas Kretz

Начать Сейчас

Продолжительность

1 ч 49 мин

Категория

Другое (ИИ)

Количество уроков

21 Видео

Дата добавления

10 окт. 2025 г., 01:41

Язык

Английский

Retrieval-Augmented Generation (RAG) - это следующий практический шаг после семантического поиска и индексации. В этом курсе вы создадите полноценный локальный RAG-конвейер, который обрабатывает PDF-файлы, разбивает тексты на фрагменты, сохраняет векторы в Elasticsearch, извлекает релевантный контекст и генерирует обоснованные ответы с помощью модели Mistral, запущенной локально через Ollama.

Мы пройдём путь от начала до конца на конкретном сценарии: поиск по резюме студентов, чтобы отвечать на вопросы вроде «Кто работал в Ирландии?» или «У кого есть опыт с Apache Spark?». Вы настроите контейнеризированную инфраструктуру на Docker Compose (FastAPI, Elasticsearch, Kibana, Streamlit, Ollama) и свяжете всё это с LlamaIndex, чтобы сосредоточиться на логике, а не на шаблонном коде. По ходу изучения вы узнаете, где RAG действительно эффективен, а где возникают сложности - например, с точностью, полнотой и "галлюцинациями" модели - и как проектировать решения для продакшена.

К концу курса у вас будет полноценное приложение, которое можно развернуть локально:

загрузка PDF - извлечение текста - преобразование в JSON - разбиение и векторизация - индексирование в Elasticsearch - интерактивный поиск через Streamlit - генерация ответов с помощью Mistral.

Что вы изучите

От поиска к RAG

Вы расширите знания о семантическом поиске и научитесь применять его для RAG: начнете с получения релевантных частей, затем будете генерировать на их основе обоснованные ответы. Узнаете, как LlamaIndex интегрирует ваши данные с LLM, и почему важны размер и перекрытие «чанков» для точности.

Создание конвейера

С помощью FastAPI вы реализуете загрузку и обработку PDF: извлечение текста, формирование JSON, разбиение, создание эмбеддингов и индексирование в Elasticsearch, с минимальным количеством шаблонного кода благодаря LlamaIndex.

Работа с Elasticsearch

Создадите индекс для резюме с векторов и метаданных. Научитесь отличать векторный поиск от поиска по ключевым словам, разберетесь, как хранятся векторные поля и как исследовать документы и результаты через Kibana.

Интерфейс на Streamlit

Создадите простой чат-интерфейс на Streamlit для взаимодействия на естественном языке. Включите режим отладки, чтобы видеть, какие фрагменты были использованы для ответа, и примените метаданные (например, фильтрацию по имени) для повышения точности.

Обработка и формирование JSON

Извлечете текст из PDF с помощью PyMuPDF, затем создадите аккуратный JSON через Ollama (Mistral), сохраняя структуру и символы. Освоите обработку ошибок форматирования и методы надежного промптирования.

Улучшение качества ответов

Изучите практические приемы для повышения точности:

настройка размеров и перекрытий чанков, топ-K выборка;
добавление метаданных (роль, навыки, местоположение) для гибридных фильтров;
эксперименты с моделями эмбеддингов и промптами;
использование структурированных ответов (например, JSON-списки).

Docker-среда

Соберете весь стек в Docker Compose: FastAPI, Elasticsearch, Kibana, Streamlit и Ollama (Mistral), чтобы развернуть систему локально с предсказуемой конфигурацией.

Бонус: Паттерны для продакшена

Вы узнаете, как масштабировать прототип до производственного уровня:

сохранять загрузки в data lake (например, S3) и обрабатывать их через очереди (Kafka/SQS);
автоматически масштабировать воркеры для чанкинга и эмбеддингов;
переключать LLM-бэкенды (например, Bedrock или OpenAI) через единый API;
сохранять историю чатов в MongoDB/Postgres и заменить Streamlit на интерфейс React/Next.js.

Посмотреть больше

Это пробный урок. Оформите подписку, чтобы получить доступ ко всем материалам курса. Премиум

Урок 1. 00:02:43

Introduction
Урок 2. 00:02:02

What We Are Going to Build
Урок 3. 00:02:41

Project Architecture
Урок 4. 00:02:59

GitHub Repo Explained
Урок 5. 00:06:06

Step-by-Step Process
Урок 6. 00:09:17

Terms You Find Often
Урок 7. 00:03:47

LlamaIndex Explained
Урок 8. 00:03:20

What is Ollama
Урок 9. 00:04:35

Ollama Setup & Testing
Урок 10. 00:03:23

Standup Infrastructure
Урок 11. 00:03:01

Show Local Processing
Урок 12. 00:05:37

Explain the API
Урок 13. 00:04:42

Explain the API Text Extraction
Урок 14. 00:06:55

Explain the Embedding
Урок 15. 00:02:57

Explain Problem with JSON Creation
Урок 16. 00:07:58

Streamlit Code Explained
Урок 17. 00:06:55

Search with Filter by User
Урок 18. 00:08:33

Do Semantic Queries
Урок 19. 00:03:31

The Biggest Problem with RAG
Урок 20. 00:05:38

How This Will Look in the Real World
Урок 21. 00:13:10

Great YouTube Videos About Real-World Use Cases

https://github.com/team-data-science/GenAI-RAG
https://github.com/team-data-science/GenAI-RAG/blob/main/test_ollama.py
https://github.com/team-data-science/GenAI-RAG/blob/main/docker-compose.yml
https://github.com/team-data-science/GenAI-RAG/blob/main/uploader.py
https://github.com/team-data-science/GenAI-RAG/tree/main/fastapi-app
https://github.com/team-data-science/GenAI-RAG/tree/main/streamlit-app

Автор - Andreas Kretz

Andreas Kretz

Я - старший инженер по данным и тренер, техноэнтузиаст и отец. Уже более десяти лет я увлечён Data Engineering. Сначала я стал инженером по данным самоучкой, а затем возглавил команду инженеров по данным в крупной компании. Когда я понял, насколько велика потребность в обучении в этой сфере, я последовал за своей страстью и основал собственную Академию Data Engineering. С тех пор я помог более чем 2 000 студентам достичь своих целей.

+21

Категории

Комментарии

Команда внимательно читает ваши комментарии и оперативно на них реагирует. Вы можете спокойно оставлять запросы на обновления или задавать любые вопросы о курсе здесь.

Другие материалы в этой категории

Изображение курса RAG для реальных AI-приложений

vueschool.io

Daniel Kelly

Justin Schroeder

Garrison Snelling

1 окт. 2025 г., 20:32

Другое (ИИ)

RAG для реальных AI-приложений

RAG for Real-World AI Applications

Модели искусственного интеллекта знают только то, на чём они были обучены - в основном это «свободная» информация из интернета: статьи, документация к API, книги и многое другое. Но что делать, если нужно, чтобы модель ИИ понимала данные за пределами её обучающего корпуса?В этом курсе вы освоите подход Retrieval Augmented Generation (RAG), позволяющий расширять возможности LLM с помощью ваших собственных данных. Вы узнаете, как работают эмбеддинг

0 ч 26 мин

Английский

Посмотреть

Изображение курса RAG: За пределами основ

Prompt Engineering

3 сент. 2025 г., 23:16

Другое (ИИ)

RAG: За пределами основ

RAG: Beyond Basics

Курс посвящён практическому и теоретическому изучению Retrieval-Augmented Generation (RAG). Вы узнаете не только «как», но и «почему» работают эти методы, а также научитесь создавать надёжные приложения формата «чат с документами» с использованием современных LLM и продвинутых техник RAG.В программе - построение базового пайплайна, переход к продвинутым стратегиям вроде re-ranking и расширения запросов, работа как с коммерческими, так и с локальн

2 ч 40 мин

Английский

Посмотреть

Изображение курса Глубокое погружение в OpenSeadragon

newline (ex fullstack.io)

25 авг. 2025 г., 21:26

Другое (Tools)

Глубокое погружение в OpenSeadragon

OpenSeadragon Deep Dive

В этом курсе вы научитесь готовить и публиковать гигантские изображения в вебе с помощью технологии масштабирования OpenSeadragon. Курс рассчитан на веб-разработчиков, которые хотят создавать по-настоящему уникальные интерфейсы с упором на иммерсивные впечатления, высокое разрешение и интерактивные оверлеи с использованием OpenSeadragon и Node.js.

0 ч 51 мин

Английский

Посмотреть

Изображение курса Системный подход к совершенствованию RAG‑приложений - Бонусыный контент

Jason Liu

22 мая 2025 г., 18:06

Другое (ИИ)

Системный подход к совершенствованию RAG‑приложений - Бонусыный контент

Systematically Improving RAG Applications - Bonus Content

Бонусная часть курса предоставляет участникам доступ к дополнительным материалам из предыдущих когорт, включая воркшопы, гостевые лекции и сессии «вопрос–ответ». Это ценный источник практических кейсов, передового опыта и глубоких технических разборов.

24 ч 50 мин

Английский

Посмотреть

Изображение курса Локальные языковые модели на практике: работа с Ollama и Vercel AI SDK

egghead

10 окт. 2025 г., 23:53

Другое (ИИ)

Локальные языковые модели на практике: работа с Ollama и Vercel AI SDK

Scripting Local Language Models with Ollama and the Vercel AI SDK

Создавайте мощные локальные скрипты на основе искусственного интеллекта Перестаньте ограничиваться простыми AI-чатами и откройте истинный потенциал локальных языковых моделей, научившись писать для них скрипты. Этот курс проведёт вас шаг за шагом через процесс создания гибкого и «умного» командного инструмента, который понимает естественный язык, взаимодействует с файловой системой и автоматизирует сложные задачи - всё это работает полностью лока

0 ч 15 мин

Английский

Посмотреть

Создание локальной системы RAG на основе LlamaIndex и Ollama

Ограничение времени просмотра

Автор - Andreas Kretz

Andreas Kretz

Другое (ИИ)

Другие материалы в этой категории

RAG для реальных AI-приложений

RAG: За пределами основ

Глубокое погружение в OpenSeadragon

Системный подход к совершенствованию RAG‑приложений - Бонусыный контент

Локальные языковые модели на практике: работа с Ollama и Vercel AI SDK