Szkolenie 2-dniowe
RAG - Retrieval Augmented Generation
Szkolenie obejmuje zapoznanie z technikami wyszukiwania dokumentów, ograniczenia halucynacji i błędnych wyników w systemach RAG. Dodatkowo pokazuje sposoby oceny poprawności działania tych systemów.
Terminy i cena szkolenia
Sprawdź najbliższe terminy szkolenia i wybierz tryb nauki, który najlepiej odpowiada Twoim preferencjom.
Cena: 2 450 zł netto + 23% VAT (3 013 zł brutto/os)
Tryb wieczorowy
Najbliższy termin: 25.03.2025 r.4 wieczory po 4 godziny (17:30-21:30).
2x wtorek i 2x czwartek.Tryb weekendowy
Najbliższy termin: 29.03.2025 r.Weekend po 8 godzin (9:00-17:00).
Sobota i niedziela.
Cele szkolenia
Przegląd metod odnajdywania dokumentów w systemach Retrieval Augmented Generation.
Poznanie strategii redukcji halucynacji oraz błędnych rezultatów w systemach RAG.
Omówienie metod weryfikacji poprawności funkcjonowania systemów RAG.
Dla kogo jest to szkolenie?
Dla programistów, którzy znają Pythona w stopniu wystarczającym do zaimplementowania kodu pobierającego dane z bazy danych lub REST API.
Wymagania
Znajomość Pythona i umiejętność korzystania z dużych modeli językowych.
Dostęp do API OpenAI.
Dlaczego warto wziąć udział w szkoleniu?
Szkolenie jest prowadzone przez osoby na co dzień zajmujące się inżynierią danych oraz uczeniem maszynowym.
Program jest ciągle uaktualniany ze względu na szybki rozwój rozwiązań, których dotyczy szkolenie.
Dużo zadań praktycznych - szkolenie zakończysz z działającym kodem, który możesz użyć w swoich projektach.
Program szkolenia
1. Wprowadzenie do systemów RAG
- ✔️ Architektura systemów RAG
- ✔️ Modele Word Embedding
2. Przygotowanie danych dla systemu RAG
- ✔️ Parsery dokumentów
- ✔️ Indeksowanie dokumentów
- ✔️ Wektorowe bazy danych
3. Techniki wyszukiwania dokumentów w systemach RAG
- ✔️ Podstawowy system RAG oparty o Semantic Search
- ✔️ Użycie wielu wersji zapytania przy użyciu techniki Query Expansion
- ✔️ Hypothetical Document Embeddings
- ✔️ Wyszukiwanie przy użyciu słów kluczowych
- ✔️ Wyszukiwanie przy użyciu metadanych
- ✔️ Parent Document Retrieval
- ✔️ Wyszukiwanie przy użyciu podzapytań
4. Ocena jakości działania systemu RAG
- ✔️ Przygotowanie danych
- ✔️ Rodzaje metryk dot. wyszukiwania danych
- ✔️ Rodzaje metryk dot. oceny wygenerowanej odpowiedzi
- ✔️ Implementacja metryk w Pythonie
5. Łączenie wyników wyszukiwania
- ✔️ Reranking - szeregowanie wyszukanych dokumentów pod względem
- ✔️ Sposoby generowania odpowiedzi
6. Systemy RAG oparte o relacyjne bazy danych
- ✔️ Wprowadzenie do Text-to-SQL
- ✔️ Implementacja RAG z użyciem Text-to-SQL
7. Techniki poprawiania jakości odpowiedzi generowanej przez AI w systemie RAG
- ✔️ Sposoby unikania halucynacji
- ✔️ Zwracanie wyniku w określonej postaci - Structured Output
- ✔️ Automatyczna weryfikacja odpowiedzi generowanej przez AI
Autor szkolenia - Bartosz Mikulski
W pracy zawodowej zajmuje się budowaniem zautomatyzowanej platformy wdrażania modeli uczenia maszynowego na produkcji. Specjalizuje się w inżynierii danych z użyciem AWS. Od 2017 roku pisze bloga o inżynierii danych, uczeniu maszynowym i sztucznej inteligencji. Napisał jeden z rozdziałów książki '97 Things Every Data Engineer Should Know'. Występuje na konferencjach i meetupach w roli prelegenta gdzie dzieli się swoim doświadczeniem ze społecznością programistów. Prowadzi szkolenia komercyjne.
Kursy PRO, na których prowadzi zajęcia:
