reklama - zainteresowany?

Data science, wyzwania i rozwi - Helion

Data science, wyzwania i rozwi
Autor: Daniel Vaughan
Tytuł oryginału: Data Science: The Hard Parts: Techniques for Excelling at Data Science
TÅ‚umaczenie: Tomasz Walczak
ISBN: 978-83-289-1294-6
stron: 232, Format: 165x235, okładka: mi
Księgarnia: Helion

Cena książki: 79,00 zł

Książka będzie dostępna od października 2024

Tagi: Analiza danych | Inne - Programowanie | Uczenie maszynowe

Uczenie si

Spis treści

Data science, wyzwania i rozwiązania. Jak zostać ekspertem analizy danych -- spis treści

Przedmowa

Część I. Techniki analityki danych

Rozdział 1. I co z tego? Generowanie wartości dzięki danologii

  • Czym jest wartość?
  • "Co?", czyli zrozumieć biznes
  • "Co z tego?", czyli istota generowania wartoÅ›ci dziÄ™ki danologii
  • "Co teraz?", czyli bÄ…dź przebojowy
  • Pomiar wartoÅ›ci
  • Najważniejsze wnioski
  • Dalsza lektura

RozdziaÅ‚ 2. Projektowanie wskaźników

  • Pożądane wÅ‚aÅ›ciwoÅ›ci wskaźników
    • Mierzalność
    • Możliwość podejmowania dziaÅ‚aÅ„
    • Trafność
    • Aktualność
  • Dekompozycja wskaźników
    • Lejek analityczny
    • Dekompozycje przepÅ‚ywów i zapasów
    • Dekompozycje typu P×Q
  • PrzykÅ‚ad: inny sposób dekompozycji przychodów
  • PrzykÅ‚ad: platformy sprzedażowe
  • Najważniejsze wnioski
  • Dalsza lektura

RozdziaÅ‚ 3. Dekompozycje wzrostu - zrozumienie przeszkód i sprzyjajÄ…cych czynników

  • Dlaczego dekompozycje wzrostu?
  • Dekompozycja addytywna
    • PrzykÅ‚ad
    • Interpretacja i przypadki użycia
  • Dekompozycja multiplikatywna
    • PrzykÅ‚ad
    • Interpretacja
  • Dekompozycja zmian wag i wartoÅ›ci
    • PrzykÅ‚ad
    • Interpretacja
  • Wyprowadzanie równaÅ„ matematycznych
    • Dekompozycja addytywna
    • Dekompozycja multiplikatywna
    • Dekompozycja mix-rate
  • Najważniejsze wnioski
  • Dalsza lektura

RozdziaÅ‚ 4. Projekty 2×2

  • Argumenty za upraszczaniem
  • Czym jest projekt 2×2?
  • PrzykÅ‚ad: testowanie modelu i nowej cechy
  • PrzykÅ‚ad: zrozumienie zachowaÅ„ użytkownika
  • PrzykÅ‚ad: udzielanie i akceptacja ofert kredytów
  • PrzykÅ‚ad: ustalanie priorytetów w procesie pracy
  • Najważniejsze wnioski
  • Dalsza lektura

Rozdział 5. Tworzenie uzasadnienia biznesowego

  • Wybrane zasady tworzenia uzasadnieÅ„ biznesowych
  • PrzykÅ‚ad: proaktywna strategia zatrzymywania klientów
  • Zapobieganie oszustwom
  • Zakup zewnÄ™trznych zbiorów danych
  • Praca nad projektem z obszaru danologii
  • Najważniejsze wnioski
  • Dalsza lektura

Rozdział 6. Czym jest wskaźnik przyrostu?

  • Definicja wskaźnika przyrostu
  • PrzykÅ‚ad: model klasyfikatora
  • BÅ‚Ä™dy wynikajÄ…ce z samoselekcji i przeżywalnoÅ›ci
  • Inne zastosowania wskaźników przyrostu
  • Najważniejsze wnioski
  • Dalsza lektura

Rozdział 7. Narracje

  • Co kryje siÄ™ w narracji? Opowiadanie historii za pomocÄ… danych
    • Jasna i rzeczowa
    • Wiarygodność
    • ZapadajÄ…ca w pamięć
    • Możliwość podejmowania dziaÅ‚aÅ„
  • Tworzenie narracji
    • Nauka jako opowiadanie historii
    • "Co?", "co z tego?" i "co teraz?"
  • Ostatnia prosta
    • Streszczenia TL;DR
    • Wskazówki dotyczÄ…ce pisania zapadajÄ…cych w pamięć streszczeÅ„ TL;DR
    • PrzykÅ‚ad: pisanie streszczenia TL;DR tego rozdziaÅ‚u
    • Skuteczne krótkie prezentacje
    • Prezentowanie narracji
  • Najważniejsze wnioski
  • Dalsza lektura

RozdziaÅ‚ 8. Wizualizacje danych - wybór wÅ‚aÅ›ciwego wykresu do przekazania komunikatu

  • Kilka przydatnych i rzadko używanych wizualizacji danych
    • Wykres sÅ‚upkowy a wykres liniowy
    • Wykres nachylenia
    • Wykres kaskadowy
    • Funkcje wygÅ‚adzania dla wykresów punktowych
    • Prezentowanie rozkÅ‚adów na wykresie
  • Ogólne zalecenia
    • Dobierz odpowiedniÄ… wizualizacjÄ™ dla przekazu
    • MÄ…drze dobieraj kolory
    • Różne wymiary na wykresie
    • Staraj siÄ™ uzyskać odpowiednio wysoki wspóÅ‚czynnik dane/atrament
    • Personalizacja a póÅ‚automatyzacja
    • Na samym poczÄ…tku dobierz odpowiedni rozmiar czcionki
    • Interaktywne czy nie?
    • Zachowaj prostotÄ™
    • Zacznij od wyjaÅ›nienia wykresu
  • Najważniejsze wnioski
  • Dalsza lektura

Część II. Uczenie maszynowe

Rozdział 9. Symulacje i bootstrapping

  • Podstawy symulacji
  • Symulacja modelu liniowego i regresji liniowej
  • Czym sÄ… wykresy zależnoÅ›ci częściowych?
  • BÅ‚Ä…d systematyczny z powodu pominiÄ™cia zmiennej
  • Symulacja problemu klasyfikacji
    • Modele zmiennych ukrytych
    • Porównanie różnych algorytmów
  • Bootstrapping
  • Najważniejsze wnioski
  • Dalsza lektura

RozdziaÅ‚ 10. Regresja liniowa - powrót do podstaw

  • Co kryje siÄ™ za wspóÅ‚czynnikiem?
  • Twierdzenie Frischa-Waugha-Lovella
  • Dlaczego twierdzenie FWL jest ważne?
  • Czynniki zakÅ‚ócajÄ…ce
  • Dodatkowe zmienne
  • Centralna rola wariancji w uczeniu maszynowym
  • Najważniejsze wnioski
  • Dalsza lektura

Rozdział 11. Wyciekanie danych

  • Czym jest wyciekanie danych?
    • Wynik również jest cechÄ…
    • Funkcja wyniku sama też jest cechÄ…
    • ZÅ‚e zmienne kontrolne
    • NiewÅ‚aÅ›ciwe oznaczenie znacznika czasu
    • Wiele zbiorów danych z nieprecyzyjnymi agregacjami czasowymi
    • Wyciekanie innych informacji
  • Wykrywanie wyciekania danych
  • CaÅ‚kowita separacja
  • Metoda okien
    • Wybór dÅ‚ugoÅ›ci okien
    • Etap treningu odzwierciedla etap oceny punktowej
    • Wdrażanie metody okien
  • Mam wyciek. Co teraz?
  • Najważniejsze wnioski
  • Dalsza lektura

Rozdział 12. Stosowanie modeli w środowisku produkcyjnym

  • Co oznacza "gotowość produkcyjna"?
    • Wsadowa ocena punktowa (w trybie offline)
    • Obiekty modeli czasu rzeczywistego
  • Dryf danych i modelu
  • Etapy niezbÄ™dne w każdym potoku produkcyjnym
    • Pobieranie i przeksztaÅ‚canie danych
    • Sprawdzanie poprawnoÅ›ci danych
    • Etapy treningu i oceny punktowej
    • Sprawdzanie poprawnoÅ›ci modelu i ocen punktowych
    • Zapisywanie modelu i ocen punktowych
  • Najważniejsze wnioski
  • Dalsza lektura

Rozdział 13. Opowiadanie historii w uczeniu maszynowym

  • Holistyczne spojrzenie na opowiadanie historii w uczeniu maszynowym
  • Opowiadanie historii przed opracowaniem modelu i w trakcie tego procesu
    • Tworzenie hipotez
    • Inżynieria cech
  • Opowiadanie historii po opracowaniu modelu: otwieranie czarnej skrzynki
    • Kompromis miÄ™dzy interpretowalnoÅ›ciÄ… a skutecznoÅ›ciÄ…
    • Regresja liniowa: ustalenie punktu odniesienia
    • Znaczenie cech
    • Mapa cieplna
    • Wykresy zależnoÅ›ci częściowych
    • Skumulowane efekty lokalne
  • Najważniejsze wnioski
  • Dalsza lektura

Rozdział 14. Od predykcji do decyzji

  • Analiza procesu podejmowania decyzji
  • Proste reguÅ‚y decyzyjne oparte na inteligentnym wyznaczaniu wartoÅ›ci progowych
    • Precyzja i czuÅ‚ość
    • PrzykÅ‚ad: pozyskiwanie list kontaktów
  • Optymalizacja macierzy bÅ‚Ä™dów
  • Najważniejsze wnioski
  • Dalsza lektura

Rozdział 15. Zmiany dodatkowe - Święty Graal danologii?

  • Definiowanie zmian dodatkowych
    • Wnioskowanie przyczynowe w celu poprawy predykcji
    • Wnioskowanie przyczynowe jako wyróżnik
    • Usprawnione podejmowanie decyzji
  • Czynniki zakÅ‚ócajÄ…ce i kolidery
  • BÅ‚Ä…d doboru
  • ZaÅ‚ożenie o braku zmiennych zakÅ‚ócajÄ…cych
  • Radzenie sobie z bÅ‚Ä™dem doboru - randomizacja
  • Dopasowywanie
  • Uczenie maszynowe i wnioskowanie przyczynowe
    • Kod otwartoźródÅ‚owy
    • Podwójne uczenie maszynowe
  • Najważniejsze wnioski
  • Dalsza lektura

Rozdział 16. Testy A/B

  • Czym sÄ… testy A/B?
  • Kryterium decyzyjne
  • Minimalne wykrywalne efekty
    • Ustalanie mocy statystycznej, poziomu istotnoÅ›ci i wartoÅ›ci P
    • Szacowanie wariancji wyniku
    • Symulacje
    • PrzykÅ‚ad: wspóÅ‚czynniki konwersji
    • OkreÅ›lanie wartoÅ›ci MWE
  • Lista hipotez do zbadania
    • Wskaźnik
    • Hipoteza
    • Uszeregowanie
  • ZarzÄ…dzanie eksperymentami
  • Najważniejsze wnioski
  • Dalsza lektura

Rozdział 17. Modele LLM i praktyka danologii

  • Obecny stan sztucznej inteligencji
  • Czym zajmujÄ… siÄ™ danologowie?
  • Ewolucja opisu stanowiska danologa
    • Studium przypadku: testy A/B
    • Studium przypadku: oczyszczanie danych
    • Studium przypadku: uczenie maszynowe
  • Modele LLM a ta książka
  • Najważniejsze wnioski
  • Dalsza lektura

Skorowidz

Code, Publish & WebDesing by CATALIST.com.pl



(c) 2005-2024 CATALIST agencja interaktywna, znaki firmowe należą do wydawnictwa Helion S.A.