Главная страницаКатегория другое (ии)Семантическая индексация и поиск логов

Семантическая индексация и поиск логов

Name: Семантическая индексация и поиск логов
Price: 13 USD
Rating: 5 (2 reviews)

Semantic Log Indexing & Search

Andreas Kretz

★5 (всего оценок - 2)

Продолжительность

0 ч 53 мин

Категория

Другое (ИИ)

Количество уроков

16 Видео

Дата добавления

9 сент. 2025 г., 13:18

Язык

Английский

Дата обновления

30 апр. 2026 г., 00:07

Семантический поиск становится ключевым инструментом для построения интеллектуальных систем обработки данных. Этот курс выводит вас за рамки теории и показывает, как применить эмбеддинги и генеративный ИИ в реальном проекте по анализу логов — от сбора данных до создания полноценного интерфейса поиска по смыслу.

Что делает курс уникальным

Вместо абстрактных примеров вы будете работать с полноценным наблюдательным стеком: логами, API, векторной БД и дашбордом. Такой подход позволяет увидеть, как технологии взаимодействуют друг с другом и как разворачивается полный цикл семантического поиска в продакшен-ориентированной среде.

Практический фокус: от данных до смысла

Работа с эмбеддингами

Вы повторите принцип работы эмбеддингов и разберётесь, как они формируют основу семантического поиска. Особое внимание уделено тому, как выбирать модели, нормализовать векторы и готовить данные для эффективного индекса.

Построение конвейера семантического поиска

FastAPI и обработка логов

Вы создадите API, которое принимает логи, обрабатывает их и генерирует эмбеддинги в режиме реального времени. Отдельные блоки посвящены структурированию данных и улучшению качества извлечения смысла.

Интеграция с qdrant

Курс показывает, как работать с коллекциями, точками и метаданными, а также как реализовать быстрый поиск по косинусному сходству. Вы узнаете, как оптимизировать хранение векторов и повысить скорость поиска на больших объёмах данных.

Интерфейс для пользователя: Streamlit

Вы разработаете дашборд, который позволяет искать в логах по смыслу, а не по ключевым словам. Отдельный модуль посвящён сравнению результатов семантического поиска с SQL-запросами в DuckDB, что помогает чётко увидеть преимущества каждого подхода.

Углублённые возможности и оптимизация

Методы повышения точности поиска

оптимизация эмбеддингов;
тонкая настройка запросов;
регулирование порогов сходства;
структурирование данных в векторной БД.

Использование DuckDB в аналитике

Вы научитесь работать с логами через DuckDB, использовать WAL и выполнять аналитические запросы. Курс показывает, как сочетать SQL и векторный поиск, чтобы получать максимально точные и полезные результаты.

Развёртывание проекта

Docker Compose для всего стека

Вы упакуете FastAPI, qdrant, Streamlit и DuckDB в единое окружение и научитесь управлять инфраструктурой с помощью Docker Compose. Это позволит вам запускать полноценный стек на любой машине и легко переносить проект.

Что вы получите на выходе

Готовый рабочий проект, который можно адаптировать для собственных задач: поиск по логам, документации, тикетам, пользовательским запросам и любым другим текстовым данным. По завершении курса вы будете понимать механику семантической индексации и уметь применять её на практике — от теории до развёртывания.

Это пробный урок. Оформите подписку, чтобы получить доступ ко всем материалам курса. Премиум

Урок 1. 00:00:44
Intro
Урок 2. 00:03:08
Getting Started: Semantic Search for Your Logs
Урок 3. 00:03:50
Dissecting the Pipeline Monitor Architecture: FastAPI, Qdrant & DuckDB
Урок 4. 00:03:28
BeginnerвЂ™s Guide to Qdrant Collections and Similarity Search
Урок 5. 00:02:55
Your First Glimpse at the Project Code Structure on GitHub
Урок 6. 00:04:37
Building and Launching the Pipeline with Docker Compose
Урок 7. 00:01:42
Writing JSON Logs to FastAPI: Bulk Upload Explained
Урок 8. 00:04:37
How FastAPI Parses LogEntry Models and Prepares Embeddings
Урок 9. 00:02:06
Embeddings 101: Turning Your Logs into Searchable Vectors
Урок 10. 00:03:55
Querying Qdrant: From Playground to Streamlit Dashboard
Урок 11. 00:03:54
Hands-On Embedding Tuning: Boost Your Log Search Accuracy
Урок 12. 00:05:35
Deploying Improved Embeddings and Measuring Improvement
Урок 13. 00:02:53
What We Built and Why It Matters
Урок 14. 00:01:28
How DuckDB Fits into Your Data Observability Stack
Урок 15. 00:05:03
Writing to DuckDB with a Write-Ahead Log
Урок 16. 00:03:42
Docker & DuckDB: Implementing WAL to Solve File Lock Errors

https://github.com/team-data-science/GenAI-DataObservability

Автор - Andreas Kretz

Andreas Kretz

Я - старший инженер по данным и тренер, техноэнтузиаст и отец. Уже более десяти лет я увлечён Data Engineering. Сначала я стал инженером по данным самоучкой, а затем возглавил команду инженеров по данным в крупной компании. Когда я понял, насколько велика потребность в обучении в этой сфере, я последовал за своей страстью и основал собственную Академию Data Engineering. С тех пор я помог более чем 2 000 студентам достичь своих целей.

+26

Комментарии