reklama - zainteresowany?

Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II - Helion

Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II
Autor: Peter Bruce, Andrew Bruce, Peter Gedeck
Tytuł oryginału: Practical Statistics for Data Scientists: 50+ Essential Concepts Using R and Python, 2nd Edition
TÅ‚umaczenie: Krzysztof Sawka, Marta Danch-Wierzchowska
ISBN: 978-83-283-7427-0
stron: 296, Format: 168x237, okładka: miękka
Data wydania: 2021-06-16
Księgarnia: Helion

Cena książki: 44,85 zł (poprzednio: 69,00 zł)
Oszczędzasz: 35% (-24,15 zł)

Dodaj do koszyka Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II

Tagi: Analiza danych | Inne | Python - Programowanie | R - Programowanie

Metody statystyczne sÄ… kluczowym narzÄ™dziem w data science, mimo to niewielu analityków danych zdobyÅ‚o wyksztaÅ‚cenie w ich zakresie. Może im to utrudniać uzyskiwanie dobrych efektów. Zrozumienie praktycznych zasad statystyki okazuje siÄ™ ważne również dla programistów R i Pythona, którzy tworzÄ… rozwiÄ…zania dla data science. Kursy podstaw statystyki rzadko jednak uwzglÄ™dniajÄ… tÄ™ perspektywÄ™, a wiÄ™kszość podrÄ™czników do statystyki w ogóle nie zajmuje siÄ™ narzÄ™dziami wywodzÄ…cymi siÄ™ z informatyki.

To drugie wydanie popularnego podrÄ™cznika statystyki przeznaczonego dla analityków danych. UzupeÅ‚niono je o obszerne przykÅ‚ady w Pythonie oraz wyjaÅ›nienie, jak stosować poszczególne metody statystyczne w problemach data science, a także jak ich nie używać. Skoncentrowano siÄ™ też na tych zagadnieniach statystyki, które odgrywajÄ… istotnÄ… rolÄ™ w data science. WyjaÅ›niono, które koncepcje sÄ… ważne i przydatne z tej perspektywy, a które mniej istotne i dlaczego. Co ważne, poszczególne koncepcje i zagadnienia praktyczne przedstawiono w sposób przyswajalny i zrozumiaÅ‚y również dla osób nienawykÅ‚ych do posÅ‚ugiwania siÄ™ statystykÄ… na co dzieÅ„.

W książce między innymi:

  • analiza eksploracyjna we wstÄ™pnym badaniu danych
  • próby losowe a jakość dużych zbiorów danych
  • podstawy planowania eksperymentów
  • regresja w szacowaniu wyników i wykrywaniu anomalii
  • statystyczne uczenie maszynowe
  • uczenie nienadzorowane a znaczenie danych niesklasyfikowanych

Statystyka: klasyczne narzędzia w najnowszych technologiach!

Dodaj do koszyka Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II

 

Osoby które kupowały "Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II", wybierały także:

  • Data Science w Pythonie. Kurs video. Przetwarzanie i analiza danych
  • Excel 2013. Kurs video. Poziom drugi. Przetwarzanie i analiza danych
  • Zarz
  • Eksploracja danych za pomoc
  • Google Analytics od podstaw. Analiza wp

Dodaj do koszyka Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II

Spis treści

Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II -- spis treści

  • Przedmowa
    • Konwencja zastosowana w tej książce
    • Wykorzystanie przykÅ‚adów kodu
    • PodziÄ™kowania
  • RozdziaÅ‚ 1. Badania eksploracyjne
    • Elementy danych uporzÄ…dkowanych
      • Dla pogÅ‚Ä™bienia wiedzy
    • Dane stabelaryzowane
      • Ramki danych i indeksy
      • Niestabelaryzowane struktury danych
      • Dla pogÅ‚Ä™bienia wiedzy
    • Miary poÅ‚ożenia
      • Åšrednia
      • Mediana i estymatory odporne
        • WartoÅ›ci odstajÄ…ce
      • PrzykÅ‚ad: miara poÅ‚ożenia dla wielkoÅ›ci populacji i wskaźnika morderstw
      • Dla pogÅ‚Ä™bienia wiedzy
    • Miary rozproszenia
      • Odchylenie standardowe i powiÄ…zane estymatory
      • Estymatory oparte na percentylach
      • PrzykÅ‚ad: szacowanie zmiennoÅ›ci dla populacji Stanów Zjednoczonych
      • Dla pogÅ‚Ä™bienia wiedzy
    • Badanie rozkÅ‚adu danych
      • Percentyle i boxploty
      • Tablica czÄ™stoÅ›ci i histogramy
      • Szacowanie i wykresy gÄ™stoÅ›ci rozkÅ‚adu
      • Dla pogÅ‚Ä™bienia wiedzy
    • Badanie danych binarnych i skategoryzowanych
      • Moda
      • Wartość oczekiwana
      • PrawdopodobieÅ„stwo
      • Dla pogÅ‚Ä™bienia wiedzy
    • Korelacja
      • Wykres punktowy
      • Dla pogÅ‚Ä™bienia wiedzy
    • Badanie dwóch lub wiÄ™cej zmiennych
      • Wykres przedziałów heksagonalnych i wykres konturowy (przedstawianie danych numerycznych wzglÄ™dem danych numerycznych)
      • Dwie zmienne skategoryzowane
      • Dane kategoryzowane i numeryczne
      • Wizualizacja wielu zmiennych
      • Dla pogÅ‚Ä™bienia wiedzy
    • Podsumowanie
  • RozdziaÅ‚ 2. RozkÅ‚ady danych i prób
    • Losowy dobór i obciążenie próby
      • Obciążenie
      • Dobór losowy
      • Rozmiar a jakość: kiedy rozmiar ma znaczenie?
      • Åšrednia z próby a Å›rednia z populacji
      • Dla pogÅ‚Ä™bienia wiedzy
    • BÅ‚Ä…d doboru
      • Regresja do Å›redniej
      • Dla pogÅ‚Ä™bienia wiedzy
    • RozkÅ‚ad próbkowania dla statystyki
      • Centralne twierdzenie graniczne
      • BÅ‚Ä…d standardowy
      • Dla pogÅ‚Ä™bienia wiedzy
    • Próby bootstrapowe
      • Ponowne próbkowanie a próby bootstrapowe
      • Dla pogÅ‚Ä™bienia wiedzy
    • PrzedziaÅ‚y ufnoÅ›ci
      • Dla pogÅ‚Ä™bienia wiedzy
    • RozkÅ‚ad normalny
      • Standaryzowany rozkÅ‚ad normalny i wykres K-K
    • RozkÅ‚ady z dÅ‚ugimi ogonami
      • Dla pogÅ‚Ä™bienia wiedzy
    • RozkÅ‚ad t-Studenta
      • Dla pogÅ‚Ä™bienia wiedzy
    • RozkÅ‚ad binarny
      • Dla pogÅ‚Ä™bienia wiedzy
    • RozkÅ‚ad chi-kwadrat
      • Dla pogÅ‚Ä™bienia wiedzy
    • RozkÅ‚ad F
      • Dla pogÅ‚Ä™bienia wiedzy
    • RozkÅ‚ad Poissona i jego pochodne
      • RozkÅ‚ad Poissona
      • RozkÅ‚ad wykÅ‚adniczy
      • Szacowanie współczynnika porażki
      • RozkÅ‚ad Weibulla
      • Dla pogÅ‚Ä™bienia wiedzy
    • Podsumowanie
  • RozdziaÅ‚ 3. Eksperymenty statystyczne i testowanie istotnoÅ›ci
    • Test A/B
      • Po co Ci grupa kontrolna?
      • Dlaczego tylko A/B? Dlaczego nie C, D itd.?
      • Dla pogÅ‚Ä™bienia wiedzy
    • Testowanie hipotezy
      • Hipoteza zerowa
      • Hipoteza alternatywna
      • Test jednostronny i test dwustronny
      • Dla pogÅ‚Ä™bienia wiedzy
    • Testy randomizacyjne
      • Test permutacyjny
      • PrzykÅ‚ad: licznik odwiedzin strony
      • ZupeÅ‚ny test permutacyjny i bootstrap
      • Test permutacyjny: podstawa w data science
      • Dla pogÅ‚Ä™bienia wiedzy
    • Istotność statystyczna i p-wartość
      • p-wartość
      • Alfa
        • Kontrowersje zwiÄ…zane z p-wartoÅ›ciÄ…
        • Istotność praktyczna
      • BÅ‚Ä™dy pierwszego i drugiego rodzaju
      • Data science i p-wartość
      • Dla pogÅ‚Ä™bienia wiedzy
    • Test t
      • Dla pogÅ‚Ä™bienia wiedzy
    • Testowanie wielokrotne
      • Dla pogÅ‚Ä™bienia wiedzy
    • Stopnie swobody
      • Dla pogÅ‚Ä™bienia wiedzy
    • ANOVA
      • Statystyka F
      • Dwustronna ANOVA
      • Dla pogÅ‚Ä™bienia wiedzy
    • Test chi-kwadrat
      • Test chi-kwadrat: podejÅ›cie randomizacyjne
      • Test chi-kwadrat: teoria
      • DokÅ‚adny test Fishera
      • Znaczenie testu chi-kwadrat w data science
      • Dla pogÅ‚Ä™bienia wiedzy
    • Algorytm WielorÄ™kiego Bandyty
      • Dla pogÅ‚Ä™bienia wiedzy
    • Moc i rozmiar próby
      • Rozmiar próby
      • Dla pogÅ‚Ä™bienia wiedzy
    • Podsumowanie
  • RozdziaÅ‚ 4. Regresja i predykcja
    • Prosta regresja liniowa
      • Równanie regresji
      • Dopasowanie wartoÅ›ci i rezydua
      • Metoda najmniejszych kwadratów
      • Predykcja a objaÅ›nienie (profilowanie)
      • Dla pogÅ‚Ä™bienia wiedzy
    • Regresja wieloraka
      • PrzykÅ‚ad: wartość domów w King County
      • Ocena modelu
      • Kroswalidacja
      • Dobór modelu i regresja krokowa
      • Regresja ważona
      • Dla pogÅ‚Ä™bienia wiedzy
    • Predykcja z wykorzystaniem regresji
      • NiebezpieczeÅ„stwa zwiÄ…zane z ekstrapolacjÄ…
      • PrzedziaÅ‚y ufnoÅ›ci i predykcji
    • Zmienne skategoryzowane w regresji
      • Zmienne fikcyjne
      • Zmienne skategoryzowane na wielu poziomach
      • UporzÄ…dkowane zmienne skategoryzowane
    • Interpretacja równania regresji
      • Predyktory skorelowane
      • Współliniowość
      • Zmienne zakłócajÄ…ce
      • Interakcje i efekty główne
    • Diagnostyka regresji
      • WartoÅ›ci odstajÄ…ce
      • Obserwacje wpÅ‚ywowe
      • Heteroskedastyczność, anormalność i bÅ‚Ä™dy skorelowane
      • Wykresy częściowych rezyduów i nieliniowość
    • Regresja wielomianowa i regresja sklejana
      • Wielomian
      • Funkcja sklejana
      • Uogólnione modele addytywne
      • Dla pogÅ‚Ä™bienia wiedzy
    • Podsumowanie
  • RozdziaÅ‚ 5. Klasyfikacja
    • Naiwny klasyfikator bayesowski
      • Dlaczego klasyfikator bayesowski jest niepraktyczny?
      • Naiwne rozwiÄ…zanie
      • Numeryczne zmienne objaÅ›niajÄ…ce
      • Dla pogÅ‚Ä™bienia wiedzy
    • Analiza dyskryminacyjna
      • Macierz kowariancji
      • Liniowy dyskryminator Fishera
      • Prosty przykÅ‚ad
      • Dla pogÅ‚Ä™bienia wiedzy
    • Regresja logistyczna
      • Funkcja odpowiedzi logistycznej i logit
      • Regresja logistyczna i GLM
      • Uogólnione modele liniowe
      • WartoÅ›ci prognozowane na podstawie regresji logistycznej
      • Interpretacja współczynników i iloraz szans
      • Regresja liniowa i regresja logistyczna: podobieÅ„stwa i różnice
        • Dopasowanie modelu
      • Ocena modelu
        • Analiza reszt
      • Dla pogÅ‚Ä™bienia wiedzy
    • Ewaluacja modeli klasyfikacji
      • Macierz bÅ‚Ä™dów
      • Problem maÅ‚o licznych klas
      • Precyzja, czuÅ‚ość i swoistość
      • Krzywa ROC
      • Pole pod wykresem krzywej ROC
      • Lift
      • Dla pogÅ‚Ä™bienia wiedzy
    • Strategie dla niezbilansowanych danych
      • Undersampling
      • Oversampling i zwiÄ™kszenie/obniżenie wag
      • Generowanie danych
      • Klasyfikacja oparta na kosztach
      • Badanie prognozy
      • Dla pogÅ‚Ä™bienia wiedzy
    • Podsumowanie
  • RozdziaÅ‚ 6. Statystyczne uczenie maszynowe
    • K-najbliższych sÄ…siadów
      • PrzykÅ‚ad: przewidywanie opóźnienia w spÅ‚acie pożyczki
      • Metryki odlegÅ‚oÅ›ci
      • Kodowanie 1 z n
      • Standaryzacja (normalizacja, z-wartość)
      • Dobór K
      • KNN w doborze cech
    • Drzewa decyzyjne
      • Prosty przykÅ‚ad
      • Algorytm rekursywnego podziaÅ‚u
      • Pomiar homogenicznoÅ›ci lub zanieczyszczenia
      • Zatrzymanie wzrostu drzewa
        • Kontrolowanie zÅ‚ożonoÅ›ci drzewa w R
        • Kontrolowanie zÅ‚ożonoÅ›ci drzewa w Pythonie
      • Prognoza ciÄ…gÅ‚ych wartoÅ›ci
      • Jak sÄ… wykorzystywane drzewa
      • Dla pogÅ‚Ä™bienia wiedzy
    • Bagging i lasy losowe
      • Bagging
      • Las losowy
      • Istotność zmiennej
      • Hiperparametry
    • Boosting
      • Algorytm wzmacniania
      • XGBoost
      • Regularyzacja: unikanie nadmiernego dopasowania
      • Hiperparametry i kroswalidacja
    • Podsumowanie
  • RozdziaÅ‚ 7. Uczenie nienadzorowane
    • Analiza głównych skÅ‚adowych
      • Prosty przykÅ‚ad
      • Obliczanie głównych skÅ‚adowych
      • Interpretacja głównych skÅ‚adowych
      • Analiza odpowiednioÅ›ci
      • Dla pogÅ‚Ä™bienia wiedzy
    • Metoda K-Å›rednich (centroidów)
      • Prosty przykÅ‚ad
      • Algorytm K-Å›rednich
      • Interpretacja klastrów
      • Dobór liczby klastrów
    • Klasteryzacja hierarchiczna
      • Prosty przykÅ‚ad
      • Dendrogram
      • Algorytm aglomeracyjny
      • Miary podobieÅ„stwa
    • Klasteryzacja oparta na modelu
      • Wielowymiarowy rozkÅ‚ad normalny
      • Mieszaniny rozkÅ‚adów normalnych
      • Dobór liczby klastrów
      • Dla pogÅ‚Ä™bienia wiedzy
    • Skalowanie i zmienne skategoryzowane
      • Skalowanie zmiennych
      • Zmienne dominujÄ…ce
      • Zmienne skategoryzowane i odlegÅ‚ość Gowera
      • Problem z klasteryzacjÄ… danych mieszanych
    • Podsumowanie
  • Bibliografia
    • O autorach
    • Kolofon

Dodaj do koszyka Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II

Code, Publish & WebDesing by CATALIST.com.pl



(c) 2005-2024 CATALIST agencja interaktywna, znaki firmowe należą do wydawnictwa Helion S.A.