Jak projektowa - Helion

MIEJSCE 22 na liście TOP 20

Autor: Chip Huyen
Tytuł oryginału: Designing Machine Learning Systems: An Iterative Process for Production-Ready Applications
Tłumaczenie: Jacek Janusz
ISBN: 978-83-283-9912-9
stron: 368, Format: 165x235, okładka: mi
Księgarnia: Helion

Książka będzie dostępna od listopada 2022

Zobacz także »

Tagi: Uczenie maszynowe

Systemy uczenia maszynowego (ML) charakteryzuj

Zobacz także:

Machine Learning i język Python. Kurs video. Praktyczne wykorzystanie popularnych bibliotek 234,71 zł, (39,90 zł -83%)
Data Science w Pythonie. Kurs video. Algorytmy uczenia maszynowego 190,00 zł, (39,90 zł -79%)
Web scraping w Data Science. Kurs video. Uczenie maszynowe i architektura splotowych sieci neuronowych 173,48 zł, (39,90 zł -77%)
Sztuczna inteligencja. Nowe spojrzenie. Wydanie IV. Tom 1 166,25 zł, (39,90 zł -76%)
G 147,78 zł, (39,90 zł -73%)

Wstęp

1. Przegląd systemów uczenia maszynowego

Kiedy należy używać uczenia maszynowego?
- Przypadki użycia uczenia maszynowego
Zrozumienie systemów uczenia maszynowego
- Uczenie maszynowe w badaniach i przemyśle
- Krytyka rankingów modeli uczenia maszynowego
- Systemy uczenia maszynowego a oprogramowanie tradycyjne
Podsumowanie

2. Wprowadzenie do projektowania systemów uczenia maszynowego

Biznes i cele uczenia maszynowego
Wymagania dla systemów uczenia maszynowego
- Niezawodność
- Skalowalność
- Łatwość utrzymania
- Adaptacyjność
Proces iteracyjny
Sformalizowanie problemów związanych z uczeniem maszynowym
- Rodzaje zadań związanych z uczeniem maszynowym
- Funkcje celu
Umysł a dane
Podsumowanie

3. Podstawy inżynierii danych

Źródła danych
Formaty danych
- JSON
- Formaty wierszowe i kolumnowe
- Format tekstowy a binarny
Modele danych
- Model relacyjny
- Model NoSQL
- Dane ustrukturyzowane a nieustrukturyzowane
Silniki przechowywania danych i ich przetwarzanie
- Przetwarzanie transakcyjne i analityczne
- Proces ETL - wyodrębnij, przekształć, wczytaj
Tryby przepływu danych
- Dane przekazywane przez bazy danych
- Dane przekazywane przez usługi
- Dane przekazywane przez połączenia w czasie rzeczywistym
Przetwarzanie wsadowe a przetwarzanie strumieniowe
Podsumowanie

4. Dane treningowe

Próbkowanie
- Próbkowanie nieprobabilistyczne
- Proste próbkowanie losowe
- Próbkowanie warstwowe
- Próbkowanie ważone
- Próbkowanie do rezerwuaru
- Próbkowanie istotnościowe
Etykietowanie
- Etykiety nadawane ręcznie
- Etykiety naturalne
- Co zrobić w przypadku braku etykiet?
Niezrównoważenie klas
- Wyzwania związane z niezrównoważeniem klas
- Rozwiązywanie problemu niezrównoważenia klas
Generowanie sztucznych danych
- Proste transformacje zachowujące etykiety
- Perturbacja
- Synteza danych
Podsumowanie

5. Inżynieria cech

Cechy wyuczone a cechy zaprojektowane
Operacje często stosowane w inżynierii cech
- Obsługa wartości brakujących
- Skalowanie
- Dyskretyzacja
- Kodowanie cech skategoryzowanych
- Krzyżowanie cech
- Dyskretne i ciągłe osadzenia pozycji
Wyciek danych
- Najczęstsze przyczyny wycieków danych
- Wykrywanie wycieku danych
Tworzenie poprawnych cech
- Ważność cech
- Uogólnianie cech
Podsumowanie

6. Projektowanie modelu i ewaluacja offline

7. Wdrażanie modelu i usługi prognozowania

Mity związane z wdrażaniem systemów uczenia maszynowego
- Mit 1. Jednocześnie wdrażamy tylko jeden lub dwa modele
- Mit 2. Jeśli nic nie zrobimy, wydajność modelu pozostanie taka sama
- Mit 3. Modeli nie trzeba często aktualizować
- Mit 4. Większość inżynierów uczenia maszynowego nie musi się przejmować wielkoskalowymi wdrożeniami
Prognozowanie wsadowe a prognozowanie online
- Od prognozowania wsadowego do prognozowania online
- Ujednolicenie potoku wsadowego i strumieniowego
Kompresowanie modelu
- Faktoryzacja niższego rzędu
- Destylacja wiedzy
- Przycinanie
- Kwantyzacja
Uczenie maszynowe w chmurze i na urządzeniu brzegowym
- Kompilowanie i optymalizowanie modeli dla urządzeń brzegowych
- Wykorzystanie uczenia maszynowego w przeglądarkach
Podsumowanie

8. Zmiana rozkładu danych i monitorowanie

Przyczyny awarii w systemach uczenia maszynowego
- Awarie systemu oprogramowania
- Awarie specyficzne dla uczenia maszynowego
Zmiany rozkładów danych
- Rodzaje zmian rozkładów danych
- Ogólne rodzaje zmian rozkładów danych
- Wykrywanie zmian rozkładów danych
- Rozwiązywanie problemów związanych ze zmianą rozkładu danych
Monitorowanie i obserwowalność
- Wskaźniki specyficzne dla uczenia maszynowego
- Narzędzia wspierające proces monitorowania
- Obserwowalność
Podsumowanie

9. Uczenie ciągłe i testy w środowisku produkcyjnym

10. Infrastruktura i narzędzia stosowane w metodyce MLOps

Pamięć masowa i moc obliczeniowa
- Chmura publiczna a prywatne centrum danych
Środowisko projektowe
- Konfiguracja środowiska projektowego
- Proces standaryzacji środowisk projektowych
- Przejście ze środowiska projektowego do produkcyjnego - kontenery
Zarządzanie zasobami
- Narzędzie cron, zarządcy procesów i orkiestratory
- Zarządzanie procesami w danetyce
Platforma uczenia maszynowego
- Wdrażanie modelu
- Magazyn modeli
- Magazyn cech
Tworzyć czy kupować?
Podsumowanie

11. Ludzka strona uczenia maszynowego

Doświadczenia użytkownika
- Zapewnianie spójności doświadczeń użytkownika
- Unikanie prognoz "przeważnie poprawnych"
- Kompromis szybkość - dokładność
Struktura zespołu
- Współpraca w zespołach międzydyscyplinarnych
- Wszechstronni danetycy
Odpowiedzialna sztuczna inteligencja
- Nieodpowiedzialna sztuczna inteligencja - studia przypadków
- Zasady tworzenia odpowiedzialnej sztucznej inteligencji
Podsumowanie

Epilog