Analiza danych z wykorzystaniem SQL-a. Zaawansowane techniki przekszta - Helion
ebook
Autor: Cathy TanimuraTytuł oryginału: SQL for Data Analysis: Advanced Techniques for Transforming Data into Insights
TÅ‚umaczenie: Tomasz Walczak
ISBN: 978-83-283-8896-3
stron: 304, Format: ebook
Data wydania: 2022-05-01
Księgarnia: Helion
Cena książki: 34,50 zł (poprzednio: 69,00 zł)
Oszczędzasz: 50% (-34,50 zł)
Tagi: SQL - Programowanie
Osoby które kupowały "Analiza danych z wykorzystaniem SQL-a. Zaawansowane techniki przekszta", wybierały także:
- Microsoft SQL Server. Kurs video. Tworzenie zaawansowanych zapytań 199,00 zł, (59,70 zł -70%)
- SQL. Kurs video. Od zera do bohatera. Modyfikowanie danych 159,00 zł, (47,70 zł -70%)
- SQL. Kurs video. Od zera do bohatera. Odczytywanie danych 159,00 zł, (47,70 zł -70%)
- SQL. Kurs video. Projektowanie i implementacja baz danych 79,00 zł, (23,70 zł -70%)
- Instalacja i konfiguracja baz danych. Kurs video. Przygotowanie do egzaminu 70-765 Provisioning SQL Databases 299,00 zł, (89,70 zł -70%)
Spis treści
Analiza danych z wykorzystaniem SQL-a. Zaawansowane techniki przekształcania danych we wnioski eBook -- spis treści
Przedmowa
Rozdział 1. Analizy z wykorzystaniem SQL-a
- Czym jest analiza danych?
- Dlaczego SQL?
- Czym jest SQL?
- Korzyści, jakie daje SQL
- SQL a R lub Python
- SQL jako element procesu analizy danych
- Rodzaje baz danych i sposoby pracy z nimi
- Wierszowe bazy danych
- Kolumnowe bazy danych
- Inne rodzaje infrastruktury danych
- Podsumowanie
Rozdział 2. Przygotowywanie danych do analiz
- Typy danych
- Typy danych w bazach
- Dane ustrukturyzowane i nieustrukturyzowane
- Dane ilościowe i jakościowe
- Dane z pierwszej, drugiej i trzeciej ręki
- Dane rzadkie
- Struktura zapytań w SQL-u
- Profilowanie - rozkład danych
- Histogramy i częstość wystąpień
- Binning
- Technika n przedziaÅ‚ów
- Profilowanie - jakość danych
- Wykrywanie duplikatów
- Deduplikacja za pomocÄ… klauzul GROUP BY i DISTINCT
- Przygotowania - oczyszczanie danych
- Oczyszczanie danych za pomocą przekształceń w instrukcji CASE
- Konwersja i rzutowanie typów
- Radzenie sobie z wartościami null: funkcje coalesce, nullif i nvl
- BrakujÄ…ce dane
- Przygotowania - kształtowanie danych
- Docelowe zastosowanie - analiza biznesowa, wizualizacja, obliczanie statystyk, uczenie maszynowe
- Tworzenie tabel przestawnych za pomocÄ… instrukcji CASE
- Przywracanie struktury po przestawieniu z użyciem instrukcji UNION
- Funkcje pivot i unpivot
- Podsumowanie
RozdziaÅ‚ 3. Analiza szeregów czasowych
- Operacje na datach, czasie oraz datach i czasie
- Zmiana strefy czasowej
- Konwersja formatu dat i znaczników czasu
- Obliczenia matematyczne na datach
- Obliczenia na czasie
- ZÅ‚Ä…czanie danych z różnych źródeÅ‚
- Zbiór danych o sprzedaży detalicznej
- Analiza trendów w danych
- Proste trendy
- Porównywanie komponentów
- Obliczanie procentów z caÅ‚oÅ›ci
- Stosowanie indeksacji do badania zmian procentowych w czasie
- Okna przesuwne
- Obliczenia na podstawie okien przesuwnych
- Okna przestawne w rzadkich zbiorach danych
- Obliczanie wartości skumulowanych
- Analiza danych z efektem sezonowości
- Porównywanie okres do okresu - rdr i mdm
- Porównania okres do okresu - te same miesiÄ…ce z kolejnych lat
- Porównywanie z wieloma wczeÅ›niejszymi okresami
- Podsumowanie
Rozdział 4. Analiza kohortowa
- Kohorty - przydatny model analiz
- Zbiór danych o czÅ‚onkach Kongresu
- Utrzymanie
- Kod w SQL-u do tworzenia prostej krzywej utrzymania
- Modyfikowanie szeregów czasowych, aby zwiÄ™kszyć dokÅ‚adność wyników analizy utrzymania
- Kohorty tworzone na podstawie szeregów czasowych
- Definiowanie kohort na podstawie odrębnej tabeli
- Jak radzić sobie z kohortami rzadkimi?
- Definiowanie kohort na podstawie dat innych niż początkowa
- PowiÄ…zane analizy kohortowe
- Przeżywalność
- Powroty (ponowne zakupy)
- Obliczanie skumulowanych wartości
- Analiza przekrojowa w kontekście analizy kohortowej
- Podsumowanie
Rozdział 5. Analiza tekstu
- Po co analizować tekst za pomocą SQL-a?
- Czym jest analiza tekstu?
- Dlaczego SQL jest dobrym narzędziem do analizy tekstu?
- Kiedy SQL nie jest dobrym wyborem?
- Zbiór danych o obserwacjach UFO
- Cechy tekstu
- Parsowanie tekstu
- Przekształcanie tekstu
- Znajdowanie elementów w wiÄ™kszych blokach tekstu
- Dopasowywanie symboli wieloznacznych: LIKE i ILIKE
- DokÅ‚adne dopasowywanie za pomocÄ… operatorów IN i NOT IN
- Wyrażenia regularne
- Tworzenie tekstu i zmienianie jego kształtu
- Konkatencja
- Zmiana kształtu tekstu
- Podsumowanie
Rozdział 6. Wykrywanie anomalii
- Możliwości i ograniczenia SQL-a w zakresie wykrywania anomalii
- Zbiór danych
- Wykrywanie wartości odstających
- Wyszukiwanie anomalii za pomocÄ… sortowania
- Wyszukiwanie anomalii na podstawie percentyli i odchylenia standardowego
- Tworzenie wykresów w celu znajdowania anomalii
- Rodzaje anomalii
- Anomalne wartości
- Anomalne liczby wystąpień
- Anomalie w postaci braku danych
- Radzenie sobie z anomaliami
- Badanie anomalii
- Usuwanie danych
- Zastępowanie innymi wartościami
- Skalowanie
- Podsumowanie
RozdziaÅ‚ 7. Analiza eksperymentów
- Wady i zalety analizy eksperymentów za pomocÄ… SQL-a
- Zbiór danych
- Rodzaje eksperymentów
- Eksperymenty z wynikami binarnymi - test chi-kwadrat
- Eksperymenty z wynikami ciągłymi - test t
- Problemy z eksperymentami i sposoby radzenia sobie z błędami
- PrzydziaÅ‚ jednostek do wariantów
- Wartości odstające
- Okna czasowe
- Eksperymenty zwiÄ…zane z wielokrotnÄ… ekspozycjÄ…
- Co robić, gdy kontrolowane eksperymenty są niemożliwe? Inne analizy
- Analiza "przed i po"
- Analiza eksperymentów naturalnych
- Analiza populacji w okolicy wartości progowej
- Podsumowanie
RozdziaÅ‚ 8. Tworzenie zÅ‚ożonych zbiorów danych na potrzeby analiz
- Kiedy używać SQL-a do tworzenia zÅ‚ożonych zbiorów danych?
- Zalety stosowania SQL-a
- Kiedy używać procesu ETL?
- Kiedy umieszczać logikę w innych narzędziach?
- PorzÄ…dkowanie kodu
- Komentarze
- Wielkość liter, wcięcia, nawiasy i inne sztuczki z obszaru formatowania
- Przechowywanie kodu
- Porządkowanie obliczeń
- PorzÄ…dek przetwarzania klauzul w SQL-u
- Podzapytania
- Tabele tymczasowe
- Wyrażenia CTE
- Instrukcja grouping sets
- Zarządzanie wielkością zbioru danych i prywatnością
- Próbkowanie na podstawie wartoÅ›ci procentowych i dzielenia modulo
- Zmniejszanie liczby wymiarów
- Dane osobowe i prywatność danych
- Podsumowanie
Rozdział 9. Podsumowanie
- Analizy lejka
- Rezygnacje, wygaÅ›niÄ™cia i inne definicje utraty klientów
- Analiza koszykowa
- Materiały
- Książki i blogi
- Zbiory danych
- Uwagi końcowe