Этот материал находится в платной подписке. Оформи премиум подписку и смотри или слушай AI Engineering Course, а также все другие курсы, прямо сейчас!
Премиум
  • Урок 1. 00:02:01
    Course Intro
  • Урок 2. 00:01:48
    Usecase
  • Урок 3. 00:06:43
    How are vectors constructed
  • Урок 4. 00:03:27
    Choosing the right DB
  • Урок 5. 00:03:27
    Vector compression
  • Урок 6. 00:06:59
    Vector Search
  • Урок 7. 00:05:38
    Milvus DB
  • Урок 8. 00:00:43
    LLM Intro
  • Урок 9. 00:08:31
    How LLMs work
  • Урок 10. 00:03:08
    LLM text generation
  • Урок 11. 00:05:10
    LLM improvements
  • Урок 12. 00:05:28
    Attention
  • Урок 13. 00:03:40
    Transformer Architecture
  • Урок 14. 00:08:28
    KV Cache
  • Урок 15. 00:04:38
    Paged Attention
  • Урок 16. 00:04:01
    Mixture Of Experts
  • Урок 17. 00:03:40
    Flash Attention
  • Урок 18. 00:03:33
    Quantization
  • Урок 19. 00:05:14
    Sparse Attention
  • Урок 20. 00:05:31
    SLM and Distillation
  • Урок 21. 00:04:58
    Speculative Decoding