Mistrz analizy danych. Od danych do wiedzy. Wydanie II - Helion
Tytuł oryginału: Data Smart: Using Data Science to Transform Information into Insight, 2nd Edition
TÅ‚umaczenie: Anna Mizerska, Konrad Matuk
ISBN: 978-83-289-1180-2
stron: 440, Format: 165x235, okładka: mi
Księgarnia: Helion
Cena książki: 99,00 zł
Książka będzie dostępna od października 2024
Mimo zainteresowania danymi i ich analiz
Zobacz także:
- Data Science w Pythonie. Kurs video. Algorytmy uczenia maszynowego 199,00 zł, (69,65 zł -65%)
- NLP. Kurs video. Analiza danych tekstowych w j 144,86 zł, (52,15 zł -64%)
- Data Science w Pythonie. Kurs video. Przetwarzanie i analiza danych 149,00 zł, (67,05 zł -55%)
- Excel 2013. Kurs video. Poziom drugi. Przetwarzanie i analiza danych 79,00 zł, (35,55 zł -55%)
- Google Analytics od podstaw. Analiza wp 69,00 zł, (34,50 zł -50%)
Spis treści
Mistrz analizy danych. Od danych do wiedzy. Wydanie II -- spis treści
Wstęp
1. Wszystko, co chciałeś wiedzieć o arkuszu kalkulacyjnym, ale bałeś się o to zapytać
- Przykładowe proste dane
- Szybkie statystyki opisowe
- Tabele Excela
- Filtrowanie i sortowanie
- Formatowanie tabeli
- Odwołania strukturalne
- Dodawanie kolumn do tabeli
- Formuły przeznaczone do wyszukiwania
- WYSZUKAJ.POZIOMO
- INDEKS/PODAJ.POZYCJĘ
- X.WYSZUKAJ
- Tabele przestawne
- Korzystanie z formuł tablicowych
- RozwiÄ…zywanie problemów za pomocÄ… narzÄ™dzia Solver
2. Ustaw i zapomnij! Wprowadzenie do Power Query
- Czym jest Power Query?
- Przykładowe dane
- Rozpoczęcie pracy z Power Query
- Filtrowanie wierszy
- Usuwanie kolumn
- Znajdź i zastąp
- Zamknij i załaduj. do tabeli
3. Naiwny klasyfikator bayesowski i niezwykła lekkość bycia idiotą
- Najszybsze na świecie wprowadzenie do rachunku prawdopodobieństwa
- Obliczanie prawdopodobieństwa warunkowego
- PrawdopodobieÅ„stwo części wspólnej, reguÅ‚a Å‚aÅ„cuchowa i niezależność
- A co, jeżeli sytuacje są zależne od siebie?
- Twierdzenie Bayesa
- Oddzielanie sygnału od szumu
- Tworzenie modelu sztucznej inteligencji za pomocÄ… twierdzenia Bayesa
- Zwykle zakÅ‚ada siÄ™, że wysokopoziomowe prawdopodobieÅ„stwa klas sÄ… sobie równe
- Kilka innych drobnostek
- Czas rozpocząć zabawę z Excelem
- PorzÄ…dkowanie danych za pomocÄ… Power Query
- Dzielenie na znakach spacji: każde słowo musi dostać to, co mu się należy
- Zliczanie leksemów i obliczanie prawdopodobieÅ„stw
- Zbudowaliśmy model. Skorzystajmy z niego!
4. Analiza skupieÅ„. Część I - zastosowanie algorytmu centroidów do segmentowania bazy klientów
- Zabawy taneczne na obozie letnim
- Prawdziwy problem: implementacja algorytmu centroidów w e-mail marketingu
- PoczÄ…tkowy zbiór danych
- Określanie tego, co chcemy mierzyć
- Zacznij od czterech grup
- Odległość euklidesowa - pomiar odległości w linii prostej
- OkreÅ›lanie poÅ‚ożenia Å›rodków klastrów
- Analiza uzyskanych wyników
- Ustalanie najlepszej oferty dla danego klastra
- Sylwetka podziaÅ‚u - dobry sposób na okreÅ›lenie optymalnej liczby klastrów
- A może potrzebujesz piÄ™ciu klastrów?
- Dzielenie klientów na pięć klastrów za pomocÄ… narzÄ™dzia Solver
- Ustalanie najlepszych ofert dla wszystkich piÄ™ciu klastrów
- OkreÅ›lanie sylwetki podziaÅ‚u na pięć klastrów
- PodziaÅ‚ na grupy za pomocÄ… algorytmu K-medioidów i asymetryczny pomiar odlegÅ‚oÅ›ci
- PodziaÅ‚ na grupy za pomocÄ… metody K-medioidów
- Stosowanie lepszego sposobu pomiaru odległości
- Implementacja za pomocÄ… Excela
- Najlepsze oferty przy podziale na pięć klastrów za pomocÄ… median
5. Analiza skupień. Część II - grafy i analiza sieci
- Czym jest graf sieci?
- Wizualizacja prostego grafu
- Wyjście poza dodatek GiGraph i listy sąsiedztwa
- Tworzenie grafu na podstawie danych sprzedaży wina
- Tworzenie macierzy podobieństwa kosinusowego
- Generowanie grafu r-sÄ…siedztwa
- Wprowadzenie do Gephi
- Tworzenie statycznej macierzy sÄ…siedztwa
- Macierz r-sÄ…siedztwa w Gephi
- Stopień rozgałęzienia
- Edycja danych grafu
- Jaka jest wartość krawędzi? Nagradzanie i karanie krawędzi - modularność grafu
- Czym jest punkt, a czym kara?
- Tworzenie arkusza punktacji
- Czas dokonać podziału na grupy
- Podział 1.
- Podział 2. - kontratak
- Podział 3. - zemsta
- Grupy - kodowanie i analiza
- Tam i z powrotem - czas na Gephi
6. Regresja jako przodek nadzorowanego uczenia maszynowego i sztucznej inteligencji
- Przewidywanie ciąży klientów na podstawie regresji liniowej
- Zbiór cech
- Tworzenie treningowego zbioru danych
- Tworzenie zmiennych fikcyjnych
- Pobawmy siÄ™ regresjÄ… liniowÄ…
- Parametry regresji liniowej: wspóÅ‚czynnik determinacji, test F i test t
- Przewidywanie ciąży na nowym zbiorze danych i sprawdzanie jakości modelu
- Przewidywanie ciąży klientów za pomocÄ… regresji logistycznej
- Najpierw musisz określić funkcję wiążącą
- Tworzenie funkcji logistycznej i ponowna optymalizacja
- Praca nad prawdziwÄ… regresjÄ… logistycznÄ…
7. Modele zespołowe - dużo nie najlepszej pizzy
- Korzystanie z danych z rozdziału 6.
- Agregacja - losuj, trenuj, powtórz
- Pieniek decyzyjny to kolejne określenie słabego klasyfikatora
- To wcale nie wydaje się takie słabe!
- Więcej mocy!
- Czas rozpocząć proces trenowania
- Ocena działania modelu zespolonego
- Wzmacnianie - jeżeli uzyskaÅ‚eÅ› niesatysfakcjonujÄ…ce wyniki, to wzmocnij swój model i uruchom go jeszcze raz
- Trenowanie modelu - każda cecha ma swoje pięć minut
- Wydajność modelu wzmacnianych reguł decyzyjnych
8. Prognozowanie - oddychaj spokojnie, i tak nie wygrasz
- Hossa na rynku sprzedaży mieczy
- Szeregi czasowe
- Zacznij od prostego wygładzania wykładniczego
- Przygotowanie arkusza prognozy prostego wygładzania wykładniczego
- Być może dane zawierają trend
- Podwójne wygÅ‚adzanie wykÅ‚adnicze (metoda Holta)
- Metoda Holta w arkuszu kalkulacyjnym
- To wszystko? Analiza autokorelacji
- Wielokrotne wygładzanie wykładnicze - model Holta-Wintersa
- Określanie początkowych wartości poziomu, trendu i sezonowości
- Tworzenie prognozy
- Czas na optymalizacjÄ™
- Interwały prognozy
- Tworzenie wykresu warstwowego wachlarza wartości
- Arkusze prognozy w Excelu
9. Modelowanie optymalizacyjne - świeżo wyciśnięty sok nie zamiesza się sam
- Ale czy to w ogóle jest analiza danych?
- Zacznijmy od prostego kompromisu
- Przedstawienie problemu w formie wielokomórki
- RozwiÄ…zywanie problemu poprzez przesuwanie poziomicy
- Metoda simpleks - krÄ™cenie siÄ™ wokóÅ‚ rogów
- Praca w Excelu
- Szklanka świeżego soku pomarańczowego prosto z drzewa. z przystankiem na modelowanie
- Zacznijmy od specyfikacji soków
- Stałość produktu wyjściowego
- Wprowadzanie danych do Excela
- Określanie problemu w dodatku Solver
- Obniżanie standardów
- Usuwanie cuchnącego problemu - minimalizacja maksymalnych odchyleń
- Warunki i ograniczenie "wielkiego M"
- Mnożenie zmiennych - skorzystajmy ze 110% mocy Excela
- Modelowanie ryzyka
- Dane pochodzące z rozkładu normalnego
10. Wykrywanie obserwacji odstajÄ…cych
- Element odstający to też człowiek
- FascynujÄ…ca sprawa Hadlumów
- Metoda Tukeya
- Implementacja metody Tukeya w arkuszu kalkulacyjnym
- Ograniczenia tej prostej techniki
- Nie tragiczny, ale słaby we wszystkim
- Przygotowywanie danych do utworzenia wykresu
- Tworzenie grafu
- OkreÅ›lanie k najbliższych sÄ…siadów
- Pierwsza metoda wykrywania elementów odstajÄ…cych grafu - skorzystaj ze stopnia wchodzÄ…cego
- Druga metoda wykrywania elementów odstajÄ…cych grafu - zgÅ‚Ä™bianie niuansów za pomocÄ… k-odlegÅ‚oÅ›ci
- Trzecia metoda wykrywania elementów odstajÄ…cych grafu - lokalny miernik stopnia oddalenia obserwacji
11. Przejście z arkusza kalkulacyjnego do języka R
- Przygotowanie środowiska i początek pracy w języku R
- Szybkie szkolenie z pisania skryptów w jÄ™zyku R
- Działania matematyczne na wektorach i faktory
- Najlepszy typ danych - dataframe
- Pomoc dla języka R
- Wyjście poza podstawowe możliwości R
- Prawdziwa analiza danych
- Wczytywanie danych do R
- Sferyczny algorytm k-średnich wywołany za pomocą zaledwie kilku linii kodu
- Budowanie modeli sztucznej inteligencji na podstawie danych zakupów (wykrywanie ciąży)
- Prognozowanie w R
- Wykrywanie elementów odstajÄ…cych
12. Wnioski
- Gdzie ja jestem? Co się stało?
- Zanim odłożysz tę książkę
- Poznaj problem
- Potrzebujemy więcej tłumaczy
- Uważaj na trójgÅ‚owe monstrum: narzÄ™dzia, wydajność i perfekcjonizm
- Nie jesteś najważniejszą osobą w firmie
- Bądź kreatywny