Jak projektowa - Helion
Tytuł oryginału: Designing Machine Learning Systems: An Iterative Process for Production-Ready Applications
Tłumaczenie: Jacek Janusz
ISBN: 978-83-283-9912-9
stron: 368, Format: 165x235, okładka: mi
Księgarnia: Helion
Książka będzie dostępna od listopada 2022
Systemy uczenia maszynowego (ML) charakteryzuj
Zobacz także:
- Data Science w Pythonie. Kurs video. Przetwarzanie i analiza danych 149,00 zł, (67,05 zł -55%)
- Machine Learning i język Python. Kurs video. Praktyczne wykorzystanie popularnych bibliotek 243,59 zł, (112,05 zł -54%)
- Matematyka w deep learningu. Co musisz wiedzie 89,00 zł, (44,50 zł -50%)
- Dylemat sztucznej inteligencji. 7 zasad odpowiedzialnego tworzenia technologii 54,90 zł, (27,45 zł -50%)
- Eksploracja danych za pomoc 67,00 zł, (33,50 zł -50%)
Spis treści
Jak projektować systemy uczenia maszynowego. Iteracyjne tworzenie aplikacji gotowych do pracy -- spis treści
Wstęp
1. Przegląd systemów uczenia maszynowego
- Kiedy należy używać uczenia maszynowego?
- Przypadki użycia uczenia maszynowego
- Zrozumienie systemów uczenia maszynowego
- Uczenie maszynowe w badaniach i przemyśle
- Krytyka rankingów modeli uczenia maszynowego
- Systemy uczenia maszynowego a oprogramowanie tradycyjne
- Podsumowanie
2. Wprowadzenie do projektowania systemów uczenia maszynowego
- Biznes i cele uczenia maszynowego
- Wymagania dla systemów uczenia maszynowego
- Niezawodność
- Skalowalność
- Łatwość utrzymania
- Adaptacyjność
- Proces iteracyjny
- Sformalizowanie problemów związanych z uczeniem maszynowym
- Rodzaje zadań związanych z uczeniem maszynowym
- Funkcje celu
- Umysł a dane
- Podsumowanie
3. Podstawy inżynierii danych
- Źródła danych
- Formaty danych
- JSON
- Formaty wierszowe i kolumnowe
- Format tekstowy a binarny
- Modele danych
- Model relacyjny
- Model NoSQL
- Dane ustrukturyzowane a nieustrukturyzowane
- Silniki przechowywania danych i ich przetwarzanie
- Przetwarzanie transakcyjne i analityczne
- Proces ETL - wyodrębnij, przekształć, wczytaj
- Tryby przepływu danych
- Dane przekazywane przez bazy danych
- Dane przekazywane przez usługi
- Dane przekazywane przez połączenia w czasie rzeczywistym
- Przetwarzanie wsadowe a przetwarzanie strumieniowe
- Podsumowanie
4. Dane treningowe
- Próbkowanie
- Próbkowanie nieprobabilistyczne
- Proste próbkowanie losowe
- Próbkowanie warstwowe
- Próbkowanie ważone
- Próbkowanie do rezerwuaru
- Próbkowanie istotnościowe
- Etykietowanie
- Etykiety nadawane ręcznie
- Etykiety naturalne
- Co zrobić w przypadku braku etykiet?
- Niezrównoważenie klas
- Wyzwania związane z niezrównoważeniem klas
- Rozwiązywanie problemu niezrównoważenia klas
- Generowanie sztucznych danych
- Proste transformacje zachowujące etykiety
- Perturbacja
- Synteza danych
- Podsumowanie
5. Inżynieria cech
- Cechy wyuczone a cechy zaprojektowane
- Operacje często stosowane w inżynierii cech
- Obsługa wartości brakujących
- Skalowanie
- Dyskretyzacja
- Kodowanie cech skategoryzowanych
- Krzyżowanie cech
- Dyskretne i ciągłe osadzenia pozycji
- Wyciek danych
- Najczęstsze przyczyny wycieków danych
- Wykrywanie wycieku danych
- Tworzenie poprawnych cech
- Ważność cech
- Uogólnianie cech
- Podsumowanie
6. Projektowanie modelu i ewaluacja offline
- Projektowanie i trenowanie modelu
- Ewaluacja modeli uczenia maszynowego
- Metody zespołowe
- Monitorowanie i wersjonowanie eksperymentów
- Trenowanie rozproszone
- Zautomatyzowane uczenie maszynowe (AutoML)
- Ewaluacja modelu w trybie offline
- Punkty odniesienia
- Metody ewaluacji
- Podsumowanie
7. Wdrażanie modelu i usługi prognozowania
- Mity związane z wdrażaniem systemów uczenia maszynowego
- Mit 1. Jednocześnie wdrażamy tylko jeden lub dwa modele
- Mit 2. Jeśli nic nie zrobimy, wydajność modelu pozostanie taka sama
- Mit 3. Modeli nie trzeba często aktualizować
- Mit 4. Większość inżynierów uczenia maszynowego nie musi się przejmować wielkoskalowymi wdrożeniami
- Prognozowanie wsadowe a prognozowanie online
- Od prognozowania wsadowego do prognozowania online
- Ujednolicenie potoku wsadowego i strumieniowego
- Kompresowanie modelu
- Faktoryzacja niższego rzędu
- Destylacja wiedzy
- Przycinanie
- Kwantyzacja
- Uczenie maszynowe w chmurze i na urządzeniu brzegowym
- Kompilowanie i optymalizowanie modeli dla urządzeń brzegowych
- Wykorzystanie uczenia maszynowego w przeglądarkach
- Podsumowanie
8. Zmiana rozkładu danych i monitorowanie
- Przyczyny awarii w systemach uczenia maszynowego
- Awarie systemu oprogramowania
- Awarie specyficzne dla uczenia maszynowego
- Zmiany rozkładów danych
- Rodzaje zmian rozkładów danych
- Ogólne rodzaje zmian rozkładów danych
- Wykrywanie zmian rozkładów danych
- Rozwiązywanie problemów związanych ze zmianą rozkładu danych
- Monitorowanie i obserwowalność
- Wskaźniki specyficzne dla uczenia maszynowego
- Narzędzia wspierające proces monitorowania
- Obserwowalność
- Podsumowanie
9. Uczenie ciągłe i testy w środowisku produkcyjnym
- Uczenie ciągłe
- Ponowne trenowanie bezstanowe i trenowanie stanowe
- Dlaczego powinno się stosować uczenie ciągłe?
- Wyzwania związane z uczeniem ciągłym
- Cztery etapy uczenia ciągłego
- Jak często należy aktualizować modele?
- Testowanie w środowisku produkcyjnym
- Użycie kopii rozwiązania
- Testy A/B
- Testy kanarkowe
- Eksperymenty przeplatane
- Algorytmy bandyty
- Podsumowanie
10. Infrastruktura i narzędzia stosowane w metodyce MLOps
- Pamięć masowa i moc obliczeniowa
- Chmura publiczna a prywatne centrum danych
- Środowisko projektowe
- Konfiguracja środowiska projektowego
- Proces standaryzacji środowisk projektowych
- Przejście ze środowiska projektowego do produkcyjnego - kontenery
- Zarządzanie zasobami
- Narzędzie cron, zarządcy procesów i orkiestratory
- Zarządzanie procesami w danetyce
- Platforma uczenia maszynowego
- Wdrażanie modelu
- Magazyn modeli
- Magazyn cech
- Tworzyć czy kupować?
- Podsumowanie
11. Ludzka strona uczenia maszynowego
- Doświadczenia użytkownika
- Zapewnianie spójności doświadczeń użytkownika
- Unikanie prognoz "przeważnie poprawnych"
- Kompromis szybkość - dokładność
- Struktura zespołu
- Współpraca w zespołach międzydyscyplinarnych
- Wszechstronni danetycy
- Odpowiedzialna sztuczna inteligencja
- Nieodpowiedzialna sztuczna inteligencja - studia przypadków
- Zasady tworzenia odpowiedzialnej sztucznej inteligencji
- Podsumowanie
Epilog