reklama - zainteresowany?

Mistrz analizy danych. Od danych do wiedzy - Helion

Mistrz analizy danych. Od danych do wiedzy
ebook
Autor: John W. Foreman
Tytuł oryginału: Data Smart: Using Data Science to Transform Information into Insight
ISBN: 978-83-283-5822-5
stron: 440, Format: ebook
Data wydania: 2017-09-21
Księgarnia: Helion

Cena książki: 63,20 zł (poprzednio: 78,02 zł)
Oszczędzasz: 19% (-14,82 zł)

Dodaj do koszyka Mistrz analizy danych. Od danych do wiedzy

Tagi: Analiza danych | Excel | Optymalizacja wydajności | R - Programowanie

Nauka o danych, znana również pod nazwą data science, jest stosunkowo nową, interdyscyplinarną dziedziną, zajmującą się różnymi technikami analizy danych, ich implementacją i wykorzystywaniem do różnych celów. Zalety nauki o danych doceniają specjaliści z wielu branż: analitycy biznesowi, statystycy, architekci oprogramowania i osoby zajmujące się sztuczną inteligencją. Tak naprawdę ta dziedzina nie koncentruje się na kodowaniu i bazach danych, ale raczej na metodach wyłuskiwania z danych najróżniejszych cennych informacji. Wartość tej wiedzy niejednokrotnie okazuje się ogromna.

Niniejsza książka jest przystępnym wprowadzeniem do nauki o danych. Jest przeznaczona dla osób, które chcą stosować techniki analizy danych w biznesie. Te techniki, opisane na podstawie praktycznych przypadków, to m.in. optymalizacja, prognozowanie i symulacja, a także sztuczna inteligencja, teoria grafów, analiza skupień i wykrywanie anomalii. Dzięki tej książce nie tylko zrozumiesz zasady analizowania danych, ale także nauczysz się wybierać technikę właściwą do rozwiązania danego problemu. Poznasz też techniki pracy z prototypami. Co ciekawe, niemal wszystkie opisane tu metody zostały zaprezentowane w arkuszu kalkulacyjnym.

W książce opisano m.in.

  • optymalizację za pomocą programowania liniowego i całkowitoliczbowego
  • szereg czasowy, wykrywanie trendów i wahań sezonowych
  • przewidywanie za pomocą wygładzania wykładniczego
  • metodę symulacji Monte Carlo
  • test Tukeya i lokalne czynniki odstające
  • język R - zaawansowane techniki analizy danych

Wyciśnij z danych każdą kroplę wiedzy!

Dodaj do koszyka Mistrz analizy danych. Od danych do wiedzy

Spis treści

Mistrz analizy danych. Od danych do wiedzy eBook -- spis treści

  • Zespół wydania oryginalengo
  • O autorze
  • O korektorach merytorycznych
  • Podziękowania
  • Wstęp
    • Co ja tutaj robię?
    • Praktyczna definicja analizy danych
    • Chwila, chwila. A co z big data?
    • Kim jestem?
    • Kim jesteś?
    • Na szczęście będziesz pracować tylko w arkuszu kalkulacyjnym
      • Ale arkusze kalkulacyjne są takie staromodne!
      • Korzystaj z programu Excel lub pakietu LibreOffice
    • Konwencje typograficzne przyjęte w tej książce
    • Zaczynamy
  • 1. Wszystko, co chciałeś wiedzieć o arkuszu kalkulacyjnym, ale bałeś się o to zapytać
    • Przykładowe proste dane
    • Szybkie przeglądanie arkusza i klawisz Ctrl
    • Szybkie kopiowanie danych i formuł
    • Formatowanie komórek
    • Wklejanie wartości specjalnych
    • Wstawianie wykresów
    • Menu Znajdź i menu Zamień
    • Formuły przeznaczone do wyszukiwania i wyciągania wartości
    • Stosowanie formuły WYSZUKAJ.PIONOWO do łączenia danych
    • Filtrowanie i sortowanie
    • Stosowanie tabel przestawnych
    • Korzystanie z formuł tablicowych
    • Rozwiązywanie problemów za pomocą narzędzia Solver
    • OpenSolver chciałbym, abyśmy go nie potrzebowali, ale
    • Podsumowanie
  • 2. Analiza skupień Część I zastosowanie algorytmu centroidów do segmentowania bazy klientów
    • Dziewczyny tańczą z dziewczynami, a chłopcy drapią się po łokciach
    • Prawdziwy problem: implementacja algorytmu centroidów w e-mail marketingu
      • Handel winem
      • Początkowy zbiór danych
      • Określanie tego, co chcemy mierzyć
      • Zacznij od czterech grup
      • Odległość euklidesowa pomiar odległości w linii prostej
      • Odległość dla wszystkich!
      • Określanie położenia środków klastrów
      • Analiza uzyskanych wyników
      • Ustalanie najlepszej oferty dla danego klastra
      • Sylwetka podziału dobry sposób na określenie optymalnej liczby klastrów
        • Sylwetka podziału na wysokim poziomie jak daleko od Ciebie są Twoi sąsiedzi?
        • Tworzenie macierzy odległości
        • Excel i implementacja sylwetki podziału
      • A może potrzebujesz pięciu klastrów?
      • Dzielenie klientów na pięć klastrów za pomocą narzędzia Solver
      • Ustalanie najlepszych ofert dla wszystkich pięciu klastrów
      • Określanie sylwetki podziału na pięć klastrów
    • Podział na grupy za pomocą algorytmu k-medioidów i asymetryczny pomiar odległości
      • Podział na grupy za pomocą metody k-medioidów
      • Stosowanie lepszego sposobu pomiaru odległości
        • Czy pomiar odległości zgodnie z metryką miejską rozwiązuje problem?
        • Odległość kosinusowa wcale nie jest czymś strasznym
      • Implementacja za pomocą Excela
      • Najlepsze oferty przy podziale na pięć klastrów za pomocą median
    • Podsumowanie
  • 3. Naiwny klasyfikator bayesowski i niezwykła lekkość bycia idiotą
    • Jeżeli nazwiesz swój produkt Mandrill, to uzyskasz zaszumione informacje zwrotne
    • Najszybsze na świecie wprowadzenie do rachunku prawdopodobieństwa
      • Obliczanie prawdopodobieństwa warunkowego
      • Prawdopodobieństwo części wspólnej, reguła łańcuchowa i niezależność
      • A co, jeżeli sytuacje są zależne od siebie?
      • Twierdzenie Bayesa
    • Tworzenie modelu sztucznej inteligencji za pomocą twierdzenia Bayesa
      • Zwykle zakłada się, że wysokopoziomowe prawdopodobieństwa klas są sobie równe
      • Kilka innych drobnostek
        • Rozwiązywanie problemu słów rzadkich
        • Rozwiązywanie problemu niedomiaru zmiennoprzecinkowego
    • Czas rozpocząć zabawę z Excelem
      • Usuwanie nieistotnych znaków interpunkcyjnych
      • Dzielenie na znakach spacji
      • Zliczanie leksemów i obliczanie prawdopodobieństw
      • Zbudowaliśmy model. Skorzystajmy z niego!
    • Podsumowanie
  • 4. Modelowanie optymalizacyjne świeżo wyciśnięty sok nie zamiesza się sam
    • Dlaczego analityk danych powinien wiedzieć, czym jest optymalizacja?
    • Zacznijmy od prostego kompromisu
      • Przedstawienie problemu w formie wielokomórki
      • Rozwiązywanie problemu poprzez przesuwanie poziomicy
      • Metoda simpleks kręcenie się wokół rogów
      • Praca w Excelu
        • Przecież nie da się wyprodukować 3,43 karabinu!
        • Spróbujmy rozwiązać problem w sposób nieliniowy
      • Na końcu tego rozdziału kryje się potwór
    • Szklanka świeżego soku pomarańczowego prosto z drzewa z przystankiem na modelowanie
      • Trzeba skorzystać z modelu mieszania
      • Zacznijmy od specyfikacji soków
      • Stałość produktu wyjściowego
      • Wprowadzanie danych do Excela
      • Określanie problemu w dodatku Solver
      • Obniżanie standardów
      • Usuwanie cuchnącego problemu minimalizacja maksymalnych odchyleń
      • Warunki i ograniczenie wielkiego M
      • Mnożenie zmiennych skorzystajmy ze 110% mocy Excela
    • Modelowanie ryzyka
      • Dane pochodzące z rozkładu normalnego
        • Dystrybuanta
        • Opracowywanie scenariuszy na podstawie odchyleń standardowych związanych z problemem mieszania soków
        • Określanie ograniczeń scenariusza
    • Podsumowanie
      • Praktyka, praktyka, praktyka i dalsza lektura
  • 5. Analiza skupień Część II grafy i analiza sieci
    • Czym jest graf sieci?
    • Wizualizacja prostego grafu
    • Krótkie wprowadzenie do Gephi
      • Instalacja Gephi i przygotowanie pliku
      • Budowa grafu
      • Stopień rozgałęzienia
      • Elegancki wydruk
      • Edycja danych grafu
    • Tworzenie grafu na podstawie danych sprzedaży wina
      • Tworzenie macierzy podobieństwa kosinusowego
      • Generowanie grafu r-sąsiedztwa
    • Jaka jest wartość krawędzi? Nagradzanie i karanie krawędzi modularność grafu
      • Czym jest punkt, a czym kara?
      • Tworzenie arkusza punktacji
    • Czas dokonać podziału na grupy
      • Podział 1.
        • Punktowanie przypisania każdego klienta
        • Tworzenie modelu liniowego obliczającego punktację
        • Tworzenie programu liniowego
      • Podział 2. kontratak
      • Podział 3. zemsta
      • Grupy kodowanie i analiza
    • Tam i z powrotem czas na Gephi
    • Podsumowanie
  • 6. Regresja jako przodek nadzorowanego uczenia maszynowego i sztucznej inteligencji
    • Co? Jesteś w ciąży?
    • Nie oszukuj siebie
      • Osoby, które nie wiedzą, jak działają modele sztucznej inteligencji, bardzo często reagują na możliwość przewidywania przyszłości z niedowierzaniem i przerażeniem. Dobrze parafrazuje to cytat z filmu Włamywacze z 1992 r.: Nie oszukuj siebie. To wcale nie jest takie inteligentne.
    • Przewidywanie ciąży klientów na podstawie regresji liniowej
      • Zbiór cech
      • Tworzenie treningowego zbioru danych
      • Tworzenie zmiennych fikcyjnych
      • Pobawmy się regresją liniową
        • Najprostsze modele liniowe
        • Wracamy do danych sprzedaży
        • Dodawanie formuły obliczającej wartość błędu
        • Trenowanie modelu za pomocą narzędzia Solver
      • Parametry regresji liniowej: współczynnik determinacji, test F i test t
        • Współczynnik determinacji parametr oceniający poprawność dopasowania
        • Test F czy dopasowanie jest istotne z punktu widzenia statystyki?
        • Testy t współczynników które zmienne są dla nas ważne?
      • Przewidywanie ciąży na nowym zbiorze danych i sprawdzanie jakości modelu
        • Określanie wartości progowej
        • Precyzja (wartości przewidziane jako pozytywne)
        • Specyficzność (liczba wyników prawdziwie negatywnych)
        • Liczba wyników fałszywie pozytywnych
        • Czułość (liczba wyników prawdziwie pozytywnych)
        • Wyznaczanie kompromisu pomiędzy wskaźnikami jakości modelu i tworzenie krzywej charakterystyki pracy
    • Przewidywanie ciąży klientów za pomocą regresji logistycznej
      • Najpierw musisz określić funkcję wiążącą
      • Tworzenie funkcji logistycznej i ponowna optymalizacja
      • Praca nad prawdziwą regresją logistyczną
      • Wybór modelu porównywanie skuteczności regresji liniowej i regresji logistycznej
    • Dalsza lektura
    • Podsumowanie
  • 7. Modele zespołowe dużo nie najlepszej pizzy
    • Korzystanie z danych z rozdziału 6.
    • Agregacja losuj, trenuj, powtórz
      • Pieniek decyzyjny to niezbyt ładne określenie głupiego modelu
      • To wcale nie wydaje się takie głupie!
      • Więcej mocy!
      • Czas rozpocząć proces trenowania
        • Tworzenie próbki losowej
        • Tworzenie pieńka decyzyjnego na podstawie wylosowanej próbki danych
        • Zapisywanie zwycięzcy
        • To tak dużo pracy!
      • Ocena działania modelu zespolonego
        • Prognozowanie wartości zbioru testowego
        • Wydajność
        • Coś więcej niż dokładność
    • Wzmacnianie jeżeli uzyskałeś niesatysfakcjonujące wyniki, to wzmocnij swój model i uruchom go jeszcze raz
      • Trenowanie modelu każda cecha ma swoje pięć minut
        • Czas wyłonić zwycięzcę
        • Obliczanie wartości parametru alfa dla najlepszej reguły decyzyjnej
        • Zmiana wag
        • Zrób to ponownie i znów i znów
      • Wydajność modelu wzmacnianych reguł decyzyjnych
        • Prognozy na testowym zbiorze danym
        • Obliczanie parametrów określających skuteczność klasyfikacji
        • Coś więcej niż dokładność
    • Podsumowanie
  • 8. Prognozowanie oddychaj spokojnie, i tak nie wygrasz
    • Hossa na rynku sprzedaży mieczy
    • Szeregi czasowe
    • Zacznij od prostego wygładzania wykładniczego
      • Przygotowanie arkusza prognozy prostego wygładzania wykładniczego
        • Dodawanie kolumn prognozy jednego kroku i jej błędu
        • Przeciągnij te formuły w dół
        • Optymalizacja błędu pojedynczego kroku
        • Czas przedstawić to na wykresie
    • Być może dane zawierają trend
    • Podwójne wygładzanie wykładnicze (metoda Holta)
      • Metoda Holta w arkuszu kalkulacyjnym
        • Prognozowanie popytu w przyszłości
        • Optymalizacja błędu prognozy pojedynczego kroku
      • To wszystko? Analiza autokorelacji
    • Wielokrotne wygładzanie wykładnicze model Holta-Wintersa
      • Określanie początkowych wartości poziomu, trendu i sezonowości
      • Tworzenie prognozy
      • Czas na optymalizację
      • Powiedz mi, że to już koniec. Proooszę!
      • Interwały prognozy
      • Tworzenie wykresu warstwowego wachlarza wartości
    • Podsumowanie
  • 9. Wykrywanie obserwacji odstających to, że jakiś element jest inny od pozostałych, nie oznacza, że jest nieistotny
    • Element odstający to też człowiek
    • Fascynująca sprawa Hadlumów
      • Metoda Tukeya
      • Implementacja metody Tukeya w arkuszu kalkulacyjnym
      • Ograniczenia tej prostej techniki
    • Nie tragiczny, ale słaby we wszystkim
      • Przygotowywanie danych do utworzenia wykresu
      • Tworzenie grafu
      • Określanie k najbliższych sąsiadów
      • Pierwsza metoda wykrywania elementów odstających grafu skorzystaj ze stopnia wchodzącego
      • Druga metoda wykrywania elementów odstających grafu zgłębianie niuansów za pomocą k-odległości
      • Trzecia metoda wykrywania elementów odstających grafu lokalny miernik stopnia oddalenia obserwacji
        • Zacznij od odległości osiągalnej
        • Określanie lokalnych mierników stopnia oddalenia obserwacji
    • Podsumowanie
  • 10. Przejście z arkusza kalkulacyjnego do języka R
    • Przygotowanie środowiska i początek pracy w języku R
      • Wprowadzanie prostych danych
        • Działania matematyczne na wektorach i faktory
        • Macierze dwuwymiarowe
        • Najlepszy typ danych dataframe
      • Wczytywanie danych do R
    • Prawdziwa analiza danych
      • Sferyczny algorytm k-średnich wywołany za pomocą zaledwie kilku linii kodu
      • Budowanie modeli sztucznej inteligencji na podstawie danych zakupów (wykrywanie ciąży)
      • Prognozowanie w R
      • Wykrywanie elementów odstających
    • Podsumowanie
  • Wnioski
    • Gdzie ja jestem? Co się stało?
    • Zanim odłożysz tę książkę
      • Poznaj problem
      • Potrzebujemy więcej tłumaczy
      • Uważaj na trójgłowe monstrum: narzędzia, wydajność i perfekcjonizm
        • Złożoność
        • Narzędzia
        • Wydajność
      • Nie jesteś najważniejszą osobą w firmie
    • Bądź kreatywny

Dodaj do koszyka Mistrz analizy danych. Od danych do wiedzy

Code, Publish & WebDesing by CATALIST.com.pl



(c) 2005-2020 CATALIST agencja interaktywna, znaki firmowe należą do wydawnictwa Helion S.A.