Rozszerzanie mo - Helion
ISBN: 978-83-283-9453-7
okładka: mi
Księgarnia: Helion
Książka będzie dostępna od sierpnia 2022
Zobacz także:
- Windows Media Center. Domowe centrum rozrywki 66,67 zł, (8,00 zł -88%)
- Ruby on Rails. Ćwiczenia 18,75 zł, (3,00 zł -84%)
- Przywództwo w świecie VUCA. Jak być skutecznym liderem w niepewnym środowisku 58,64 zł, (12,90 zł -78%)
- Scrum. O zwinnym zarządzaniu projektami. Wydanie II rozszerzone 58,64 zł, (12,90 zł -78%)
- Od hierarchii do turkusu, czyli jak zarządzać w XXI wieku 58,64 zł, (12,90 zł -78%)
Spis treści
Dodaj mocy Power BI! Jak za pomocą kodu w Pythonie i R pobierać, przekształcać i wizualizować dane -- spis treści
Przedmowa
O autorze
O recenzentach
Wstęp
Część I. Najlepsze praktyki korzystania z języków R i Python w usłudze Power BI
Rozdział 1. Gdzie i jak używać w usłudze Power BI skryptów języka R i Python?
- Wymagania techniczne
- Wstrzykiwanie skryptów języka R lub Python do usługi Power BI
- Ładowanie danych
- Przekształcanie danych
- Wizualizacja danych
- Korzystanie z języków R i Python do interakcji z danymi
- Ograniczenia stosowania języków R i Python dla różnych produktów usługi Power BI
- Podsumowanie
Rozdział 2. Konfigurowanie języka R na potrzeby usługi Power BI
- Wymagania techniczne
- Dostępne silniki języka R
- Dystrybucja CRAN R
- Dystrybucja Microsoft R Open i MRAN
- Klient Microsoft R
- Stopniowe wycofywanie dystrybucji Microsoft R Open
- Wybór silnika języka R do zainstalowania
- Silniki języka R używane w usłudze Power BI
- Instalowanie sugerowanych silników języka R
- Instalowanie środowiska IDE w celu programowania w języku R
- Instalacja programu RStudio
- Konfigurowanie programu Power BI Desktop do pracy z językiem R
- Konfigurowanie usługi Power BI do pracy z językiem R
- Instalowanie lokalnej bramy danych w trybie osobistym
- Udostępnianie raportów używających skryptów języka R w usłudze Power BI
- Ograniczenia wizualizacji języka R
- Podsumowanie
Rozdział 3. Konfigurowanie języka Python na potrzeby usługi Power BI
- Wymagania techniczne
- Dostępne silniki Pythona
- Wybór silnika języka Python do zainstalowania
- Silniki języka Python wykorzystywane w usłudze Power BI
- Instalowanie sugerowanych silników języka Python
- Instalowanie środowiska IDE na potrzeby programowania w języku Python
- Konfigurowanie obsługi Pythona w środowisku programu RStudio
- Konfigurowanie języka Python w środowisku programu Visual Studio Code
- Konfigurowanie programu Power BI Desktop do pracy z językiem Python
- Konfigurowanie usługi Power BI do pracy z językiem R
- Udostępnianie raportów używających skryptów języka Python w usłudze Power BI
- Ograniczenia wizualizacji w Pythonie
- Podsumowanie
Część II. Pozyskiwanie i przekształcanie danych za pomocą języków R i Python w usłudze Power BI
Rozdział 4. Importowanie nieobsługiwanych obiektów danych
- Wymagania techniczne
- Importowanie plików RDS w języku R
- Krótkie wprowadzenie do Tidyverse
- Tworzenie zserializowanych obiektów w języku R
- Korzystanie z plików RDS w usłudze Power BI
- Importowanie plików PKL w Pythonie
- Krótkie wprowadzenie do PyData
- Tworzenie zserializowanego obiektu Pythona
- Korzystanie z pliku PKL w usłudze Power BI
- Podsumowanie
- Bibliografia
Rozdział 5. Korzystanie z wyrażeń regularnych w usłudze Power BI
- Wymagania techniczne
- Krótkie wprowadzenie do regeksów
- Podstawowe informacje o regeksach
- Sprawdzanie poprawności adresów e-mail
- Sprawdzanie poprawności dat
- Sprawdzanie poprawności danych przy użyciu regeksów w usłudze Power BI
- Korzystanie z regeksów w usłudze Power BI do sprawdzania poprawności adresów e-mail z wykorzystaniem języka Python
- Korzystanie z regeksów w usłudze Power BI do sprawdzania poprawności adresów e-mail za pomocą języka R
- Korzystanie z regeksów w usłudze Power BI do sprawdzania poprawności dat za pomocą języka Python
- Korzystanie z regeksów w usłudze Power BI do sprawdzania poprawności dat za pomocą języka R
- Ładowanie do usługi Power BI złożonych plików logów z wykorzystaniem regeksów
- Logi dostępu do serwera Apache
- Importowanie logów dostępu serwera Apache w usłudze Power BI za pomocą języka Python
- Importowanie logów dostępu serwera Apache w usłudze Power BI za pomocą języka R
- Wyodrębnianie wartości z tekstu w usłudze Power BI przy użyciu regeksów
- Jeden regex do zarządzania wszystkimi danymi
- Używanie regeksów w usłudze Power BI do wyodrębniania wartości z wykorzystaniem języka Python
- Korzystanie z regeksów w usłudze Power BI do wyodrębniania wartości za pomocą języka R
- Podsumowanie
- Bibliografia
Rozdział 6. Anonimizacja i pseudonimizacja danych w usłudze Power BI
- Wymagania techniczne
- Deidentyfikacja danych
- Techniki deidentyfikacji
- Istota pseudonimizacji
- Czym jest anonimizacja?
- Anonimizacja danych w usłudze Power BI
- Anonimizacja danych za pomocą języka Python
- Anonimizacja danych za pomocą języka R
- Pseudonimizacja danych w usłudze Power BI
- Pseudonimizacja danych za pomocą języka Python
- Pseudonimizacja danych w języku R
- Podsumowanie
- Bibliografia
Rozdział 7. Zapisywanie danych z usługi Power BI do źródeł zewnętrznych
- Wymagania techniczne
- Zapis danych do plików CSV
- Zapis do plików CSV w języku Python
- Zapis informacji do plików CSV za pomocą języka R
- Zapisywanie informacji do plików programu Excel
- Zapisywanie informacji do plików Excela za pomocą języka Python
- Zapis do plików Excela za pomocą języka R
- Zapis danych do serwera Azure SQL Server
- Instalacja programu SQL Server Express
- Tworzenie bazy danych w usłudze Azure SQL Database
- Zapis danych do serwera Azure SQL Server za pomocą języka Python
- Zapis danych na serwerze Azure SQL za pomocą języka R
- Podsumowanie
- Bibliografia
Rozdział 8. Ładowanie do usługi Power BI zbiorów danych przekraczających dostępną pamięć RAM
- Wymagania techniczne
- Typowy scenariusz analityczny obejmujący wykorzystanie obszernego zestawu danych
- Importowanie dużych zestawów danych w języku Python
- Instalowanie Dask na laptopie
- Tworzenie obiektów DataFrame pakietu Dask
- Wyodrębnianie informacji z obiektu DataFrame pakietu Dask
- Importowanie dużego zestawu danych w usłudze Power BI z wykorzystaniem języka Python
- Importowanie dużych zestawów danych za pomocą języka R
- Instalowanie pakietu disk.frame na laptopie
- Tworzenie egzemplarza obiektu disk.frame
- Wyodrębnianie informacji z obiektu disk.frame
- Importowanie dużego zestawu danych w usłudze Power BI za pomocą języka R
- Podsumowanie
- Bibliografia
Część III. Wzbogacanie danych w usłudze Power BI za pomocą języków R i Python
Rozdział 9. Wywoływanie zewnętrznych interfejsów API w celu wzbogacania danych
- Wymagania techniczne
- Czym jest usługa sieciowa?
- Rejestrowanie się w usłudze Bing Maps Web Services
- Geokodowanie adresów z wykorzystaniem języka Python
- Korzystanie z jawnego żądania GET
- Korzystanie ze współbieżnych żądań GET
- Korzystanie z biblioteki Geocoder w trybie programowania współbieżnego
- Geokodowanie adresów za pomocą języka R
- Korzystanie z jawnych żądań GET
- Korzystanie ze współbieżnych żądań GET
- Korzystanie z pakietu tidygeocoder do współbieżnego wykonywania kodu
- Korzystanie z usług sieciowych z poziomu usługi Power BI
- Geokodowanie adresów w usłudze Power BI za pomocą języka Python
- Geokodowanie adresów w usłudze Power BI za pomocą języka R
- Podsumowanie
- Bibliografia
Rozdział 10. Obliczanie kolumn przy użyciu złożonych algorytmów
- Wymagania techniczne
- Obliczanie odległości między dwiema lokalizacjami geograficznymi
- Trygonometria sferyczna
- Twierdzenie cosinusów
- Wzór Haversinesa
- Wzór Vincenty'ego
- Jakiego wzoru odległości używać i kiedy?
- Implementacja algorytmów wyznaczania odległości w Pythonie
- Obliczanie odległości w języku Python
- Obliczanie odległości w usłudze Power BI za pomocą języka Python
- Implementacja algorytmów wyznaczania odległości w języku R
- Obliczanie odległości za pomocą języka R
- Obliczanie odległości w usłudze Power BI za pomocą języka R
- Podstawy programowania liniowego
- Równania i nierówności liniowe
- Formułowanie problemu optymalizacji liniowej
- Definicja problemu LP do rozwiązania
- Formułowanie problemu LP
- Rozwiązywanie problemów optymalizacji w języku Python
- Rozwiązywanie problemu LP za pomocą języka Python
- Rozwiązywanie problemu programowania liniowego za pomocą języka Python w usłudze Power BI
- Rozwiązywanie problemów programowania liniowego za pomocą języka R
- Rozwiązywanie problemu LP w języku R
- Rozwiązywanie problemu programowania liniowego za pomocą języka R w usłudze Power BI
- Podsumowanie
- Bibliografia
Rozdział 11. Dodawanie statystyk: powiązania
- Wymagania techniczne
- Badanie powiązań między zmiennymi
- Korelacja między zmiennymi liczbowymi
- Współczynnik korelacji Karla Pearsona
- Współczynnik korelacji Charlesa Spearmana
- Współczynnik korelacji Maurice'a Kendalla
- Opis przypadku
- Implementacja obliczeń współczynników korelacji w Pythonie
- Implementacja obliczeń współczynników korelacji w języku R
- Implementacja obliczania współczynników korelacji w usłudze Power BI za pomocą języków Python i R
- Korelacje między zmiennymi kategorycznymi a liczbowymi
- Związek między dwiema zmiennymi kategorycznymi
- Związki pomiędzy zmiennymi liczbowymi a kategorycznymi
- Implementacja obliczania współczynników korelacji w Pythonie
- Implementacja obliczania współczynników korelacji w języku R
- Implementacja obliczania współczynników korelacji w usłudze Power BI za pomocą języków R i Python
- Podsumowanie
- Bibliografia
Rozdział 12. Dodawanie statystyk: wartości odstające i wartości brakujące
- Wymagania techniczne
- Czym są wartości odstające i jak sobie z nimi radzić?
- Przyczyny istnienia wartości odstających
- Obsługa wartości odstających
- Identyfikacja wartości odstających
- Jednowymiarowe wartości odstające
- Wielowymiarowe wartości odstające
- Implementacja algorytmów wykrywania wartości odstających
- Implementacja wykrywania wartości odstających w Pythonie
- Implementacja wykrywania wartości odstających w języku R
- Implementacja wykrywania wartości odstających w usłudze Power BI
- Czym są wartości brakujące i jak sobie z nimi radzić?
- Przyczyny brakujących wartości
- Obsługa wartości brakujących
- Diagnozowanie brakujących wartości z wykorzystaniem języków R i Python
- Implementacja algorytmów imputacji brakujących wartości
- Usuwanie brakujących wartości
- Imputacja danych tabelarycznych
- Imputacja danych szeregów czasowych
- Imputacja brakujących wartości w usłudze Power BI
- Podsumowanie
- Bibliografia
Rozdział 13. Korzystanie z uczenia maszynowego bez licencji Premium lub Embedded
- Wymagania techniczne
- Interakcje z mechanizmami uczenia maszynowego w usłudze Power BI z wykorzystaniem przepływów danych
- Korzystanie z rozwiązań AutoML
- PyCaret
- Azure AutoML
- RemixAutoML dla języka R
- Osadzanie kodu szkoleniowego w dodatku Power Query
- Szkolenie i korzystanie z modeli ML z wykorzystaniem biblioteki PyCaret
- Korzystanie z biblioteki PyCaret w usłudze Power BI
- Korzystanie z przeszkolonych modeli w dodatku Power Query
- Ocena obserwacji w dodatku Power Query przy użyciu przeszkolonego modelu PyCaret
- Korzystanie z przeszkolonych modeli w wizualizacjach utworzonych za pomocą skryptów
- Ocenianie obserwacji w skrypcie wizualizacji z wykorzystaniem przeszkolonego modelu PyCaret
- Wywoływanie usług sieciowych w dodatku Power Query
- Korzystanie z usług Cognitive Services w dodatku Power Query
- Podsumowanie
- Bibliografia
Część IV. Wizualizacja danych za pomocą języka R w usłudze Power BI
Rozdział 14. Eksploracyjna analiza danych
- Wymagania techniczne
- Jaki jest cel EDA?
- Zrozumienie sensu danych
- Oczyszczanie danych
- Odkrywanie powiązań między zmiennymi
- Analiza EDA z wykorzystaniem języków R i Python
- Analiza EDA w usłudze Power BI
- Strona podsumowania zestawu danych
- Eksploracja brakujących wartości
- Eksploracja jednowymiarowa
- Eksploracja wielowymiarowa
- Powiązania zmiennych
- Podsumowanie
- Bibliografia
Rozdział 15. Zaawansowane wizualizacje
- Wymagania techniczne
- Tworzenie wykresu kołowego
- Implementacja kołowego wykresu słupkowego w języku R
- Implementacja kołowego wykresu słupkowego w usłudze Power BI
- Podsumowanie
- Bibliografia
Rozdział 16. Interaktywne niestandardowe wizualizacje języka R
- Wymagania techniczne
- Zalety stosowania interaktywnych niestandardowych wizualizacji w języku R
- Dodawanie elementów interaktywnych za pomocą biblioteki Plotly
- Wykorzystanie elementów interaktywnych za pośrednictwem widżetów HTML
- Tworzenie niestandardowych wizualizacji w usłudze Power BI
- Instalowanie pakietu pbiviz
- Tworzenie pierwszej niestandardowej wizualizacji R HTML
- Importowanie pakietu niestandardowej wizualizacji do usługi Power BI
- Podsumowanie
- Bibliografia
Skorowidz