reklama - zainteresowany?

SQL w analizie danych. Zaawansowane techniki wyci - Helion

SQL w analizie danych. Zaawansowane techniki wyci

MIEJSCE 6 na liście TOP 20
Autor: Cathy Tanimura
Tytuł oryginału: SQL for Data Analysis: Advanced Techniques for Transforming Data into Insights
Tłumaczenie: Tomasz Walczak
ISBN: 978-83-283-8895-6
stron: 340, Format: 168x237, okładka: mi
Data wydania: 2022-04-01
Księgarnia: Helion

Cena książki: 44,85 zł (poprzednio: 69,00 zł)
Oszczędzasz: 35% (-24,15 zł)

Dodaj do koszyka SQL w analizie danych. Zaawansowane techniki wyci

Tagi: SQL - Programowanie

J

Dodaj do koszyka SQL w analizie danych. Zaawansowane techniki wyci

 

Osoby które kupowały "SQL w analizie danych. Zaawansowane techniki wyci", wybierały także:

  • PL/SQL. Kurs video. Od podstaw do zagadnień zaawansowanych. Programowanie baz danych
  • SQL. Kurs video. Od podstaw do zagadnień zaawansowanych. Tworzenie baz danych
  • Microsoft SQL Server. Kurs video. Tworzenie zaawansowanych zapytań
  • SQL. Kurs video. Od zera do bohatera. Modyfikowanie danych
  • SQL. Kurs video. Od zera do bohatera. Odczytywanie danych

Dodaj do koszyka SQL w analizie danych. Zaawansowane techniki wyci

Spis treści

Analiza danych z wykorzystaniem SQL-a. Zaawansowane techniki przekształcania danych we wnioski -- spis treści

Przedmowa

Rozdział 1. Analizy z wykorzystaniem SQL-a

  • Czym jest analiza danych?
  • Dlaczego SQL?
    • Czym jest SQL?
    • Korzyści, jakie daje SQL
    • SQL a R lub Python
    • SQL jako element procesu analizy danych
  • Rodzaje baz danych i sposoby pracy z nimi
    • Wierszowe bazy danych
    • Kolumnowe bazy danych
    • Inne rodzaje infrastruktury danych
  • Podsumowanie

Rozdział 2. Przygotowywanie danych do analiz

  • Typy danych
    • Typy danych w bazach
    • Dane ustrukturyzowane i nieustrukturyzowane
    • Dane ilościowe i jakościowe
    • Dane z pierwszej, drugiej i trzeciej ręki
    • Dane rzadkie
  • Struktura zapytań w SQL-u
  • Profilowanie - rozkład danych
    • Histogramy i częstość wystąpień
    • Binning
    • Technika n przedziałów
  • Profilowanie - jakość danych
    • Wykrywanie duplikatów
    • Deduplikacja za pomocą klauzul GROUP BY i DISTINCT
  • Przygotowania - oczyszczanie danych
    • Oczyszczanie danych za pomocą przekształceń w instrukcji CASE
    • Konwersja i rzutowanie typów
    • Radzenie sobie z wartościami null: funkcje coalesce, nullif i nvl
    • Brakujące dane
  • Przygotowania - kształtowanie danych
    • Docelowe zastosowanie - analiza biznesowa, wizualizacja, obliczanie statystyk, uczenie maszynowe
    • Tworzenie tabel przestawnych za pomocą instrukcji CASE
    • Przywracanie struktury po przestawieniu z użyciem instrukcji UNION
    • Funkcje pivot i unpivot
  • Podsumowanie

Rozdział 3. Analiza szeregów czasowych

  • Operacje na datach, czasie oraz datach i czasie
    • Zmiana strefy czasowej
    • Konwersja formatu dat i znaczników czasu
    • Obliczenia matematyczne na datach
    • Obliczenia na czasie
    • Złączanie danych z różnych źródeł
  • Zbiór danych o sprzedaży detalicznej
  • Analiza trendów w danych
    • Proste trendy
    • Porównywanie komponentów
    • Obliczanie procentów z całości
    • Stosowanie indeksacji do badania zmian procentowych w czasie
  • Okna przesuwne
    • Obliczenia na podstawie okien przesuwnych
    • Okna przestawne w rzadkich zbiorach danych
    • Obliczanie wartości skumulowanych
  • Analiza danych z efektem sezonowości
    • Porównywanie okres do okresu - rdr i mdm
    • Porównania okres do okresu - te same miesiące z kolejnych lat
    • Porównywanie z wieloma wcześniejszymi okresami
  • Podsumowanie

Rozdział 4. Analiza kohortowa

  • Kohorty - przydatny model analiz
  • Zbiór danych o członkach Kongresu
  • Utrzymanie
    • Kod w SQL-u do tworzenia prostej krzywej utrzymania
    • Modyfikowanie szeregów czasowych, aby zwiększyć dokładność wyników analizy utrzymania
    • Kohorty tworzone na podstawie szeregów czasowych
    • Definiowanie kohort na podstawie odrębnej tabeli
    • Jak radzić sobie z kohortami rzadkimi?
    • Definiowanie kohort na podstawie dat innych niż początkowa
  • Powiązane analizy kohortowe
    • Przeżywalność
    • Powroty (ponowne zakupy)
    • Obliczanie skumulowanych wartości
  • Analiza przekrojowa w kontekście analizy kohortowej
  • Podsumowanie

Rozdział 5. Analiza tekstu

  • Po co analizować tekst za pomocą SQL-a?
    • Czym jest analiza tekstu?
    • Dlaczego SQL jest dobrym narzędziem do analizy tekstu?
    • Kiedy SQL nie jest dobrym wyborem?
  • Zbiór danych o obserwacjach UFO
  • Cechy tekstu
  • Parsowanie tekstu
  • Przekształcanie tekstu
  • Znajdowanie elementów w większych blokach tekstu
    • Dopasowywanie symboli wieloznacznych: LIKE i ILIKE
    • Dokładne dopasowywanie za pomocą operatorów IN i NOT IN
    • Wyrażenia regularne
  • Tworzenie tekstu i zmienianie jego kształtu
    • Konkatencja
    • Zmiana kształtu tekstu
  • Podsumowanie

Rozdział 6. Wykrywanie anomalii

  • Możliwości i ograniczenia SQL-a w zakresie wykrywania anomalii
  • Zbiór danych
  • Wykrywanie wartości odstających
    • Wyszukiwanie anomalii za pomocą sortowania
    • Wyszukiwanie anomalii na podstawie percentyli i odchylenia standardowego
    • Tworzenie wykresów w celu znajdowania anomalii
  • Rodzaje anomalii
    • Anomalne wartości
    • Anomalne liczby wystąpień
    • Anomalie w postaci braku danych
  • Radzenie sobie z anomaliami
    • Badanie anomalii
    • Usuwanie danych
    • Zastępowanie innymi wartościami
    • Skalowanie
  • Podsumowanie

Rozdział 7. Analiza eksperymentów

  • Wady i zalety analizy eksperymentów za pomocą SQL-a
  • Zbiór danych
  • Rodzaje eksperymentów
    • Eksperymenty z wynikami binarnymi - test chi-kwadrat
    • Eksperymenty z wynikami ciągłymi - test t
  • Problemy z eksperymentami i sposoby radzenia sobie z błędami
    • Przydział jednostek do wariantów
    • Wartości odstające
    • Okna czasowe
    • Eksperymenty związane z wielokrotną ekspozycją
  • Co robić, gdy kontrolowane eksperymenty są niemożliwe? Inne analizy
    • Analiza "przed i po"
    • Analiza eksperymentów naturalnych
    • Analiza populacji w okolicy wartości progowej
  • Podsumowanie

Rozdział 8. Tworzenie złożonych zbiorów danych na potrzeby analiz

  • Kiedy używać SQL-a do tworzenia złożonych zbiorów danych?
    • Zalety stosowania SQL-a
    • Kiedy używać procesu ETL?
    • Kiedy umieszczać logikę w innych narzędziach?
  • Porządkowanie kodu
    • Komentarze
    • Wielkość liter, wcięcia, nawiasy i inne sztuczki z obszaru formatowania
    • Przechowywanie kodu
  • Porządkowanie obliczeń
    • Porządek przetwarzania klauzul w SQL-u
    • Podzapytania
    • Tabele tymczasowe
    • Wyrażenia CTE
    • Instrukcja grouping sets
  • Zarządzanie wielkością zbioru danych i prywatnością
    • Próbkowanie na podstawie wartości procentowych i dzielenia modulo
    • Zmniejszanie liczby wymiarów
    • Dane osobowe i prywatność danych
  • Podsumowanie

Rozdział 9. Podsumowanie

  • Analizy lejka
  • Rezygnacje, wygaśnięcia i inne definicje utraty klientów
  • Analiza koszykowa
  • Materiały
    • Książki i blogi
    • Zbiory danych
  • Uwagi końcowe

Dodaj do koszyka SQL w analizie danych. Zaawansowane techniki wyci

Code, Publish & WebDesing by CATALIST.com.pl



(c) 2005-2022 CATALIST agencja interaktywna, znaki firmowe należą do wydawnictwa Helion S.A.