reklama - zainteresowany?

Mistrz analizy danych. Od danych do wiedzy. Wydanie II - Helion

Mistrz analizy danych. Od danych do wiedzy. Wydanie II
Autor: Jordan Goldmeier
Tytuł oryginału: Data Smart: Using Data Science to Transform Information into Insight, 2nd Edition
TÅ‚umaczenie: Anna Mizerska, Konrad Matuk
ISBN: 978-83-289-1180-2
stron: 440, Format: 165x235, okładka: mi
Księgarnia: Helion

Cena książki: 99,00 zł

Książka będzie dostępna od października 2024

Tagi: Analiza danych

Mimo zainteresowania danymi i ich analiz

Spis treści

Mistrz analizy danych. Od danych do wiedzy. Wydanie II -- spis treści

Wstęp

1. Wszystko, co chciałeś wiedzieć o arkuszu kalkulacyjnym, ale bałeś się o to zapytać

  • PrzykÅ‚adowe proste dane
  • Szybkie statystyki opisowe
  • Tabele Excela
    • Filtrowanie i sortowanie
    • Formatowanie tabeli
    • OdwoÅ‚ania strukturalne
    • Dodawanie kolumn do tabeli
  • FormuÅ‚y przeznaczone do wyszukiwania
    • WYSZUKAJ.POZIOMO
    • INDEKS/PODAJ.POZYCJĘ
    • X.WYSZUKAJ
  • Tabele przestawne
  • Korzystanie z formuÅ‚ tablicowych
  • RozwiÄ…zywanie problemów za pomocÄ… narzÄ™dzia Solver

2. Ustaw i zapomnij! Wprowadzenie do Power Query

  • Czym jest Power Query?
  • PrzykÅ‚adowe dane
  • RozpoczÄ™cie pracy z Power Query
  • Filtrowanie wierszy
  • Usuwanie kolumn
  • Znajdź i zastÄ…p
  • Zamknij i zaÅ‚aduj. do tabeli

3. Naiwny klasyfikator bayesowski i niezwykła lekkość bycia idiotą

  • Najszybsze na Å›wiecie wprowadzenie do rachunku prawdopodobieÅ„stwa
    • Obliczanie prawdopodobieÅ„stwa warunkowego
    • PrawdopodobieÅ„stwo części wspólnej, reguÅ‚a Å‚aÅ„cuchowa i niezależność
    • A co, jeżeli sytuacje sÄ… zależne od siebie?
    • Twierdzenie Bayesa
  • Oddzielanie sygnaÅ‚u od szumu
  • Tworzenie modelu sztucznej inteligencji za pomocÄ… twierdzenia Bayesa
    • Zwykle zakÅ‚ada siÄ™, że wysokopoziomowe prawdopodobieÅ„stwa klas sÄ… sobie równe
    • Kilka innych drobnostek
  • Czas rozpocząć zabawÄ™ z Excelem
    • PorzÄ…dkowanie danych za pomocÄ… Power Query
    • Dzielenie na znakach spacji: każde sÅ‚owo musi dostać to, co mu siÄ™ należy
    • Zliczanie leksemów i obliczanie prawdopodobieÅ„stw
    • ZbudowaliÅ›my model. Skorzystajmy z niego!

4. Analiza skupieÅ„. Część I - zastosowanie algorytmu centroidów do segmentowania bazy klientów

  • Zabawy taneczne na obozie letnim
  • Prawdziwy problem: implementacja algorytmu centroidów w e-mail marketingu
    • PoczÄ…tkowy zbiór danych
    • OkreÅ›lanie tego, co chcemy mierzyć
    • Zacznij od czterech grup
    • OdlegÅ‚ość euklidesowa - pomiar odlegÅ‚oÅ›ci w linii prostej
    • OkreÅ›lanie poÅ‚ożenia Å›rodków klastrów
    • Analiza uzyskanych wyników
    • Ustalanie najlepszej oferty dla danego klastra
    • Sylwetka podziaÅ‚u - dobry sposób na okreÅ›lenie optymalnej liczby klastrów
    • A może potrzebujesz piÄ™ciu klastrów?
    • Dzielenie klientów na pięć klastrów za pomocÄ… narzÄ™dzia Solver
    • Ustalanie najlepszych ofert dla wszystkich piÄ™ciu klastrów
    • OkreÅ›lanie sylwetki podziaÅ‚u na pięć klastrów
  • PodziaÅ‚ na grupy za pomocÄ… algorytmu K-medioidów i asymetryczny pomiar odlegÅ‚oÅ›ci
    • PodziaÅ‚ na grupy za pomocÄ… metody K-medioidów
    • Stosowanie lepszego sposobu pomiaru odlegÅ‚oÅ›ci
    • Implementacja za pomocÄ… Excela
    • Najlepsze oferty przy podziale na pięć klastrów za pomocÄ… median

5. Analiza skupień. Część II - grafy i analiza sieci

  • Czym jest graf sieci?
  • Wizualizacja prostego grafu
    • WyjÅ›cie poza dodatek GiGraph i listy sÄ…siedztwa
  • Tworzenie grafu na podstawie danych sprzedaży wina
    • Tworzenie macierzy podobieÅ„stwa kosinusowego
    • Generowanie grafu r-sÄ…siedztwa
  • Wprowadzenie do Gephi
    • Tworzenie statycznej macierzy sÄ…siedztwa
    • Macierz r-sÄ…siedztwa w Gephi
    • StopieÅ„ rozgaÅ‚Ä™zienia
    • Edycja danych grafu
  • Jaka jest wartość krawÄ™dzi? Nagradzanie i karanie krawÄ™dzi - modularność grafu
    • Czym jest punkt, a czym kara?
    • Tworzenie arkusza punktacji
  • Czas dokonać podziaÅ‚u na grupy
    • PodziaÅ‚ 1.
    • PodziaÅ‚ 2. - kontratak
    • PodziaÅ‚ 3. - zemsta
    • Grupy - kodowanie i analiza
  • Tam i z powrotem - czas na Gephi

6. Regresja jako przodek nadzorowanego uczenia maszynowego i sztucznej inteligencji

  • Przewidywanie ciąży klientów na podstawie regresji liniowej
    • Zbiór cech
    • Tworzenie treningowego zbioru danych
    • Tworzenie zmiennych fikcyjnych
    • Pobawmy siÄ™ regresjÄ… liniowÄ…
    • Parametry regresji liniowej: wspóÅ‚czynnik determinacji, test F i test t
    • Przewidywanie ciąży na nowym zbiorze danych i sprawdzanie jakoÅ›ci modelu
  • Przewidywanie ciąży klientów za pomocÄ… regresji logistycznej
    • Najpierw musisz okreÅ›lić funkcjÄ™ wiążącÄ…
    • Tworzenie funkcji logistycznej i ponowna optymalizacja
    • Praca nad prawdziwÄ… regresjÄ… logistycznÄ…

7. Modele zespołowe - dużo nie najlepszej pizzy

  • Korzystanie z danych z rozdziaÅ‚u 6.
  • Agregacja - losuj, trenuj, powtórz
    • Pieniek decyzyjny to kolejne okreÅ›lenie sÅ‚abego klasyfikatora
    • To wcale nie wydaje siÄ™ takie sÅ‚abe!
    • WiÄ™cej mocy!
    • Czas rozpocząć proces trenowania
    • Ocena dziaÅ‚ania modelu zespolonego
  • Wzmacnianie - jeżeli uzyskaÅ‚eÅ› niesatysfakcjonujÄ…ce wyniki, to wzmocnij swój model i uruchom go jeszcze raz
    • Trenowanie modelu - każda cecha ma swoje pięć minut
    • Wydajność modelu wzmacnianych reguÅ‚ decyzyjnych

8. Prognozowanie - oddychaj spokojnie, i tak nie wygrasz

  • Hossa na rynku sprzedaży mieczy
  • Szeregi czasowe
  • Zacznij od prostego wygÅ‚adzania wykÅ‚adniczego
    • Przygotowanie arkusza prognozy prostego wygÅ‚adzania wykÅ‚adniczego
  • Być może dane zawierajÄ… trend
  • Podwójne wygÅ‚adzanie wykÅ‚adnicze (metoda Holta)
    • Metoda Holta w arkuszu kalkulacyjnym
    • To wszystko? Analiza autokorelacji
  • Wielokrotne wygÅ‚adzanie wykÅ‚adnicze - model Holta-Wintersa
    • OkreÅ›lanie poczÄ…tkowych wartoÅ›ci poziomu, trendu i sezonowoÅ›ci
    • Tworzenie prognozy
    • Czas na optymalizacjÄ™
    • InterwaÅ‚y prognozy
    • Tworzenie wykresu warstwowego wachlarza wartoÅ›ci
  • Arkusze prognozy w Excelu

9. Modelowanie optymalizacyjne - świeżo wyciśnięty sok nie zamiesza się sam

  • Ale czy to w ogóle jest analiza danych?
  • Zacznijmy od prostego kompromisu
    • Przedstawienie problemu w formie wielokomórki
    • RozwiÄ…zywanie problemu poprzez przesuwanie poziomicy
    • Metoda simpleks - krÄ™cenie siÄ™ wokóÅ‚ rogów
    • Praca w Excelu
  • Szklanka Å›wieżego soku pomaraÅ„czowego prosto z drzewa. z przystankiem na modelowanie
    • Zacznijmy od specyfikacji soków
    • StaÅ‚ość produktu wyjÅ›ciowego
    • Wprowadzanie danych do Excela
    • OkreÅ›lanie problemu w dodatku Solver
    • Obniżanie standardów
    • Usuwanie cuchnÄ…cego problemu - minimalizacja maksymalnych odchyleÅ„
    • Warunki i ograniczenie "wielkiego M"
    • Mnożenie zmiennych - skorzystajmy ze 110% mocy Excela
  • Modelowanie ryzyka
    • Dane pochodzÄ…ce z rozkÅ‚adu normalnego

10. Wykrywanie obserwacji odstajÄ…cych

  • Element odstajÄ…cy to też czÅ‚owiek
  • FascynujÄ…ca sprawa Hadlumów
    • Metoda Tukeya
    • Implementacja metody Tukeya w arkuszu kalkulacyjnym
    • Ograniczenia tej prostej techniki
  • Nie tragiczny, ale sÅ‚aby we wszystkim
    • Przygotowywanie danych do utworzenia wykresu
    • Tworzenie grafu
    • OkreÅ›lanie k najbliższych sÄ…siadów
    • Pierwsza metoda wykrywania elementów odstajÄ…cych grafu - skorzystaj ze stopnia wchodzÄ…cego
    • Druga metoda wykrywania elementów odstajÄ…cych grafu - zgÅ‚Ä™bianie niuansów za pomocÄ… k-odlegÅ‚oÅ›ci
    • Trzecia metoda wykrywania elementów odstajÄ…cych grafu - lokalny miernik stopnia oddalenia obserwacji

11. Przejście z arkusza kalkulacyjnego do języka R

  • Przygotowanie Å›rodowiska i poczÄ…tek pracy w jÄ™zyku R
    • Szybkie szkolenie z pisania skryptów w jÄ™zyku R
    • DziaÅ‚ania matematyczne na wektorach i faktory
    • Najlepszy typ danych - dataframe
    • Pomoc dla jÄ™zyka R
    • WyjÅ›cie poza podstawowe możliwoÅ›ci R
  • Prawdziwa analiza danych
    • Wczytywanie danych do R
    • Sferyczny algorytm k-Å›rednich wywoÅ‚any za pomocÄ… zaledwie kilku linii kodu
    • Budowanie modeli sztucznej inteligencji na podstawie danych zakupów (wykrywanie ciąży)
    • Prognozowanie w R
    • Wykrywanie elementów odstajÄ…cych

12. Wnioski

  • Gdzie ja jestem? Co siÄ™ staÅ‚o?
  • Zanim odÅ‚ożysz tÄ™ książkÄ™
    • Poznaj problem
    • Potrzebujemy wiÄ™cej tÅ‚umaczy
    • Uważaj na trójgÅ‚owe monstrum: narzÄ™dzia, wydajność i perfekcjonizm
    • Nie jesteÅ› najważniejszÄ… osobÄ… w firmie
  • BÄ…dź kreatywny

Code, Publish & WebDesing by CATALIST.com.pl



(c) 2005-2024 CATALIST agencja interaktywna, znaki firmowe należą do wydawnictwa Helion S.A.