Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym - Helion
ebook
Autor: Alex J. Gutman, Jordan GoldmeierTytuł oryginału: Becoming a Data Head: How to Think, Speak and Understand Data Science, Statistics and Machine Learning
Tłumaczenie: Grzegorz Werner
ISBN: 978-83-289-0216-9
stron: 256, Format: ebook
Księgarnia: Helion
Cena książki: 69,00 zł
Książka będzie dostępna od września 2023
Musisz spojrze
Zobacz także:
- Databricks. Kurs video. Wst 148,98 zł, (59,59 zł -60%)
- Apache NiFi. Kurs video. Automatyzacja przep 148,98 zł, (59,59 zł -60%)
- Web scraping. Kurs video. Zautomatyzowane pozyskiwanie danych z sieci 139,00 zł, (62,55 zł -55%)
- Data Science w Pythonie. Kurs video. Przetwarzanie i analiza danych 149,00 zł, (67,05 zł -55%)
- Excel 2013. Kurs video. Poziom drugi. Przetwarzanie i analiza danych 79,00 zł, (35,55 zł -55%)
Spis treści
Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym eBook -- spis treści
O autorach
O redaktorach technicznych
Podziękowania
Przedmowa
Wprowadzenie
CZĘŚĆ I. MYŚL JAK SPEC OD DANYCH
- ROZDZIAŁ 1. NA CZYM POLEGA PROBLEM?
- PYTANIA, KTÓRE POWINIEN ZADAWAĆ SPEC OD DANYCH
- Dlaczego problem jest ważny?
- Na kogo wpływa ten problem?
- Co, jeśli nie mamy właściwych danych?
- Kiedy projekt się zakończy?
- Co, jeśli nie spodobają nam się rezultaty?
- DLACZEGO PROJEKTY ZWIĄZANE Z DANYMI KOŃCZĄ SIĘ NIEPOWODZENIEM?
- Wrażenia klientów
- Omówienie
- PRACA NAD PROBLEMAMI, KTÓRE MAJĄ ZNACZENIE
- PODSUMOWANIE ROZDZIAŁU
- PYTANIA, KTÓRE POWINIEN ZADAWAĆ SPEC OD DANYCH
- ROZDZIAŁ 2. CZYM SĄ DANE?
- DANE A INFORMACJE
- Przykładowy zbiór danych
- TYPY DANYCH
- JAK GROMADZI SIĘ DANE I JAKĄ MAJĄ STRUKTURĘ?
- Dane obserwacyjne i eksperymentalne
- Dane ustrukturyzowane i nieustrukturyzowane
- PODSTAWOWE STATYSTYKI ZBIORCZE
- PODSUMOWANIE ROZDZIAŁU
- DANE A INFORMACJE
- ROZDZIAŁ 3. PRZYGOTOWANIE DO MYŚLENIA STATYSTYCZNEGO
- ZADAWAJ PYTANIA
- WSZYSTKO JEST ZMIENNE
- Scenariusz: wrażenia klientów (kontynuacja)
- Studium przypadku: zachorowalność na raka nerki
- PRAWDOPODOBIEŃSTWO I STATYSTYKA
- Prawdopodobieństwo a intuicja
- Odkrywanie informacji za pomocą statystyki
- PODSUMOWANIE ROZDZIAŁU
CZĘŚĆ II. MÓW JAK SPEC OD DANYCH
- ROZDZIAŁ 4. POLEMIZUJ Z DANYMI
- CO BYŚ ZROBIŁ(A)?
- Katastrofa spowodowana brakiem danych
- JAKA JEST HISTORIA POCHODZENIA DANYCH?
- Kto zebrał dane?
- Jak zebrano dane?
- CZY DANE SĄ REPREZENTATYWNE?
- Czy poprawnie dobrano próbę?
- Co zrobiono z wartościami odstającymi?
- JAKICH DANYCH NIE WIDZĘ?
- Jak rozwiązano problem brakujących wartości?
- Czy dane mogą zmierzyć to, co ma być mierzone?
- POLEMIZUJ Z DANYMI KAŻDEJ WIELKOŚCI
- PODSUMOWANIE ROZDZIAŁU
- CO BYŚ ZROBIŁ(A)?
- ROZDZIAŁ 5. EKSPLORUJ DANE
- EKSPLORACYJNA ANALIZA DANYCH I TY
- PRZYJMIJ NASTAWIENIE EKSPLORACYJNE
- Pytania naprowadzające
- Scenariusz
- CZY DANE MOGĄ ODPOWIEDZIEĆ NA PYTANIE?
- Określ oczekiwania i użyj zdrowego rozsądku
- Czy wartości mają intuicyjny sens?
- Uważaj! Wartości odstające i brakujące
- CZY ODKRYLIŚCIE JAKIEŚ ZWIĄZKI?
- Korelacja
- Uważaj! Błędne interpretowanie korelacji
- Uważaj! Korelacja nie implikuje przyczynowości
- CZY ZNALEŹLIŚCIE W DANYCH NOWE MOŻLIWOŚCI?
- PODSUMOWANIE ROZDZIAŁU
- ROZDZIAŁ 6. BADAJ PRAWDOPODOBIEŃSTWA
- ZGADNIJ ODPOWIEDŹ
- REGUŁY GRY
- Notacja
- Prawdopodobieństwo warunkowe i zdarzenia niezależne
- Prawdopodobieństwo wielu zdarzeń
- ĆWICZENIE MYŚLOWE Z ZAKRESU PRAWDOPODOBIEŃSTWA
- Następne kroki
- UWAŻAJ Z ZAKŁADANIEM NIEZALEŻNOŚCI
- Nie popełniaj błędu hazardzisty
- WSZYSTKIE PRAWDOPODOBIEŃSTWA SĄ WARUNKOWE
- Nie przestawiaj zależności
- Twierdzenie Bayesa
- UPEWNIJ SIĘ, ŻE PRAWDOPODOBIEŃSTWA MAJĄ ZNACZENIE
- Kalibracja
- Rzadkie zdarzenia mogą się zdarzać i się zdarzają
- PODSUMOWANIE ROZDZIAŁU
- ROZDZIAŁ 7. KWESTIONUJ STATYSTYKI
- KRÓTKIE LEKCJE O WNIOSKOWANIU
- Zostaw sobie trochę przestrzeni
- Więcej danych, więcej dowodów
- Kwestionuj status quo
- Dowody na twierdzenie przeciwne
- Równoważenie błędów decyzyjnych
- PROCES WNIOSKOWANIA STATYSTYCZNEGO
- PYTANIA, KTÓRE POMOGĄ CI KWESTIONOWAĆ STATYSTYKI
- Jaki jest kontekst tych statystyk?
- Jaki jest rozmiar próby?
- Co testujecie?
- Jaka jest hipoteza zerowa?
- Jaki jest poziom istotności?
- Ile przeprowadzacie testów?
- Czy mogę zobaczyć przedziały ufności?
- Czy jest to praktycznie istotne?
- Czy zakładacie przyczynowość?
- PODSUMOWANIE ROZDZIAŁU
- KRÓTKIE LEKCJE O WNIOSKOWANIU
CZĘŚĆ III. PRZYBORNIK SPECJALISTY DATA SCIENCE
- ROZDZIAŁ 8. W POSZUKIWANIU UKRYTYCH GRUP
- UCZENIE NIENADZOROWANE
- REDUKCJA WYMIAROWOŚCI
- Tworzenie cech złożonych
- ANALIZA SKŁADOWYCH GŁÓWNYCH
- Składowe główne zdolności sportowych
- Podsumowanie PCA
- Potencjalne pułapki
- KLASTERYZACJA
- KLASTERYZACJA METODĄ K-ŚREDNICH
- Klasteryzacja sklepów detalicznych
- Potencjalne pułapki
- PODSUMOWANIE ROZDZIAŁU
- ROZDZIAŁ 9. MODEL REGRESJI
- UCZENIE NADZOROWANE
- JAK DZIAŁA REGRESJA LINIOWA?
- Regresja metodą najmniejszych kwadratów: nie tylko pomysłowa nazwa
- REGRESJA LINIOWA: CO CI DAJE?
- Rozszerzanie modelu na wiele cech
- REGRESJA LINIOWA: JAKIE POWODUJE NIEPOROZUMIENIA?
- Pominięte zmienne
- Współliniowość
- Przeciek danych
- Błędy ekstrapolacji
- Relacje nie zawsze są liniowe
- Wyjaśniasz czy przewidujesz?
- Skuteczność regresji
- INNE MODELE REGRESJI
- PODSUMOWANIE ROZDZIAŁU
- ROZDZIAŁ 10. MODEL KLASYFIKACJI
- WPROWADZENIE DO KLASYFIKACJI
- Czego się nauczysz?
- Przykładowy problem klasyfikacj
- REGRESJA LOGISTYCZNA
- Regresja logistyczna - i co z tego?
- DRZEWA DECYZYJNE
- METODY ZESPOŁOWE
- Lasy losowe
- Drzewa wzmacniane gradientowo
- Interpretowalność modeli zespołowych
- STRZEŻ SIĘ PUŁAPEK
- Złe podejście do problemu
- Przeciek danych
- Brak podziału danych
- Wybór odpowiedniego progu decyzyjnego
- BŁĘDNE ROZUMIENIE DOKŁADNOŚCI
- Macierze błędów
- PODSUMOWANIE ROZDZIAŁU
- WPROWADZENIE DO KLASYFIKACJI
- ROZDZIAŁ 11. ANALIZA TEKSTU
- OCZEKIWANIA WOBEC ANALIZY TEKSTU
- JAK TEKST STAJE SIĘ LICZBAMI
- Wielki worek słów
- N-gramy
- Osadzenia słów
- MODELOWANIE TEMATYCZNE
- KLASYFIKACJA TEKSTU
- Naiwny klasyfikator byesowski
- Analiza odczuć
- KWESTIE PRAKTYCZNE PODCZAS PRACY Z TEKSTEM
- Giganci technologiczni mają przewagę
- PODSUMOWANIE ROZDZIAŁU
- ROZDZIAŁ 12. UCZENIE GŁĘBOKIE
- SIECI NEURONOWE
- Pod jakimi względami sieci neuronowe przypominają ludzki mózg?
- Prosta sieć neuronowa
- Jak uczy się sieć neuronowa?
- Nieco bardziej złożona sieć neuronowa
- ZASTOSOWANIA UCZENIA GŁĘBOKIEGO
- Korzyści z uczenia głębokiego
- Jak komputery "widzą" obrazy?
- Konwolucyjne sieci neuronowe
- Uczenie głębokie w języku i sekwencjach
- UCZENIE GŁĘBOKIE W PRAKTYCE
- Czy masz dane?
- Czy Twoje dane są ustrukturyzowane?
- Jak będzie wyglądać sieć?
- SZTUCZNA INTELIGENCJA I TY
- Giganci technologiczni mają przewagę
- Etyka w uczeniu głębokim
- PODSUMOWANIE ROZDZIAŁU
- SIECI NEURONOWE
CZĘŚĆ IV. DROGA DO SUKCESU
- ROZDZIAŁ 13. STRZEŻ SIĘ PUŁAPEK
- TENDENCYJNOŚĆ I DZIWNE ZJAWISKA W DANYCH
- Błąd przeżywalności
- Regresja do średniej
- Paradoks Simpsona
- Błąd konfirmacj
- Błąd utopionych kosztów
- Dyskryminacja algorytmiczna
- Nieskategoryzowane przejawy tendencyjności
- WIELKA LISTA PUŁAPEK
- Pułapki związane ze statystyką i uczeniem maszynowym
- Pułapki związane z projektem
- PODSUMOWANIE ROZDZIAŁU
- TENDENCYJNOŚĆ I DZIWNE ZJAWISKA W DANYCH
- ROZDZIAŁ 14. ZNAJ LUDZI I OSOBOWOŚCI
- SIEDEM SCENARIUSZY FIASKA KOMUNIKACYJNEGO
- Post mortem
- Wieczorynka
- Głuchy telefon
- W gąszczu szczegółów
- Konfrontacja z rzeczywistością
- Wrogie przejęcie
- Egocentryk
- OSOBOWOŚCI W ŚWIECIE DANYCH
- Entuzjasta
- Cynik
- Spec od danych
- PODSUMOWANIE ROZDZIAŁU
- SIEDEM SCENARIUSZY FIASKA KOMUNIKACYJNEGO
- ROZDZIAŁ 15. CO DALEJ?