Data Science. Programowanie, analiza i wizualizacja danych z wykorzystaniem języka R - Helion
Tytuł oryginału: Programming Skills for Data Science: Start Writing Code to Wrangle, Analyze, and Visualize Data with R
TÅ‚umaczenie: Tomasz Walczak
ISBN: 978-83-283-5783-9
stron: 353, Format: ebook
Data wydania: 2019-10-01
Księgarnia: Helion
Cena książki: 51,75 zł (poprzednio: 69,00 zł)
Oszczędzasz: 25% (-17,25 zł)
Aby surowe dane przekuć w gotowÄ… do wykorzystania wiedzÄ™, potrzebna jest umiejÄ™tność ich analizy, przeksztaÅ‚cania i niekiedy również wizualizacji. NagrodÄ… za wÅ‚ożony w to wysiÅ‚ek jest lepsze rozumienie różnych zÅ‚ożonych zagadnieÅ„ z wielu dziedzin wiedzy. Co wiÄ™cej, znajomość procesów programowego przetwarzania danych pozwala na szybkie wykrywanie i opisywanie wzorców danych, praktycznie niemożliwych do dostrzeżenia innymi technikami. Dla wielu badaczy jednak barierÄ… na drodze do skorzystania z tych atrakcyjnych możliwoÅ›ci jest konieczność pisania kodu.
Oto podrÄ™cznik programowania w jÄ™zyku R dla analityków danych, szczególnie przydatny dla osób, które nie majÄ… doÅ›wiadczenia w tej dziedzinie. DokÅ‚adnie opisano tu potrzebne narzÄ™dzia i technologie. Zamieszczono wskazówki dotyczÄ…ce instalacji i konfiguracji oprogramowania do pisania kodu, wykonywania go i zarzÄ…dzania nim, a także Å›ledzenia wersji projektów i zmian w nich oraz korzystania z innych podstawowych mechanizmów. Poszczególne kroki tworzenia kodu w jÄ™zyku R wyjaÅ›niono dokÅ‚adnie i przystÄ™pnie. DziÄ™ki tej książce można pÅ‚ynnie przejść do konkretnych zadaÅ„ i budować potrzebne aplikacje. Zrozumienie prezentowanych w niej treÅ›ci uÅ‚atwiajÄ… liczne przykÅ‚ady i ćwiczenia, co pozwala szybko przystÄ…pić do skutecznego analizowania wÅ‚asnych zbiorów danych.
W tej książce między innymi:
- przygotowanie środowiska pracy i rozpoczęcie programowania w R
- podstawy zarzÄ…dzania projektami, kontrola wersji i generowanie dokumentacji
- ramki danych, pakiety dplyr i tidyr
- kod do wizualizacji danych i pakiet ggplot2
- tworzenie aplikacji i techniki wspóÅ‚pracy w zespoÅ‚ach specjalistów
Po prostu R i dane. Wyciśniesz każdą kroplę wiedzy!
Osoby które kupowały "Data Science. Programowanie, analiza i wizualizacja danych z wykorzystaniem języka R", wybierały także:
- R i pakiet shiny. Kurs video. Interaktywne aplikacje w analizie danych 148,98 zł, (59,59 zł -60%)
- Zaawansowana analiza danych. Jak przej 59,90 zł, (29,95 zł -50%)
- Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II 69,00 zł, (34,50 zł -50%)
- Język R. Receptury. Analiza danych, statystyka i przetwarzanie grafiki. Wydanie II 89,00 zł, (44,50 zł -50%)
- Deep Learning. Praca z językiem R i biblioteką Keras 77,00 zł, (38,50 zł -50%)
Spis treści
Data Science. Programowanie, analiza i wizualizacja danych z wykorzystaniem języka R eBook -- spis treści
- Przedmowa
- Wprowadzenie
- Główny temat książki
- Dla kogo przeznaczona jest ta książka?
- Struktura książki
- Część I. Wprowadzenie
- Część II. Zarządzanie projektami
- Część III. Podstawowe umiejętności z zakresu języka R
- Część IV. Przekształcanie danych
- Część V. Wizualizacja danych
- Część VI. Tworzenie i udostępnianie aplikacji
- Konwencje stosowane w książce
- Jak czytać tę książkę?
- PowiÄ…zany kod
- Podziękowania
- O autorach
- I. Wprowadzenie
- 1. Przygotowywanie komputera
- Pisanie kodu
- ZarzÄ…dzanie kodem
- Wykonywanie kodu
- 1.1. Przygotowywanie narzędzi używanych w wierszu poleceń
- 1.1.1. Wiersz poleceń w systemie macOS
- 1.1.2. Wiersz poleceń w systemie Windows
- 1.1.3. Wiersz poleceń w systemie Linux
- 1.2. Instalowanie systemu git
- 1.3. Tworzenie konta w serwisie GitHub
- 1.4. Wybieranie edytora tekstu
- 1.4.1. Atom
- 1.4.2. Visual Studio Code
- 1.4.3. Sublime Text
- 1.5. Pobieranie języka R
- 1.6. Pobieranie środowiska RStudio
- 2. Używanie wiersza poleceń
- 2.1. Uruchamianie wiersza poleceń
- 2.2. Poruszanie się w systemie plików
- 2.2.1. Przechodzenie do innego katalogu
- 2.2.2. Wyświetlanie listy plików
- 2.2.3. Ścieżki
- 2.3. ZarzÄ…dzanie plikami
- 2.3.1. Uczenie siÄ™ nowych instrukcji
- 2.3.2. Symbole wieloznaczne
- 2.4. Radzenie sobie z błędami
- 2.5. Przekierowywanie danych wyjściowych
- 2.6. Polecenia zwiÄ…zane z sieciÄ…
- II. ZarzÄ…dzanie projektami
- 3. Kontrola wersji z użyciem systemu git i serwisu GitHub
- 3.1. Czym jest git?
- 3.1.1. Podstawowe zagadnienia zwiÄ…zane z systemem git
- 3.1.2. Czym jest GitHub?
- 3.2. Konfigurowanie narzędzi i tworzenie projektu
- 3.2.1. Tworzenie repozytorium
- 3.2.2. Sprawdzanie stanu
- 3.3. Åšledzenie zmian w projekcie
- 3.3.1. Dodawanie plików
- 3.3.2. Zatwierdzanie
- 3.3.2.1. Etykieta dotyczÄ…ca informacji na temat rewizji
- 3.3.3. Proces używania systemu git
- 3.4. Zapisywanie projektów w witrynie GitHub
- 3.4.1. Forki i klonowanie
- 3.4.2. Wysyłanie i pobieranie
- 3.5. Dostęp do historii projektu
- 3.5.1. Historia rewizji
- 3.5.2. Powrót do starszych wersji
- 3.6. Ignorowanie plików w projekcie
- 3.1. Czym jest git?
- 4. Tworzenie dokumentacji za pomocą języka Markdown
- 4.1. Pisanie kodu w języku Markdown
- 4.1.1. Formatowanie tekstu
- 4.1.2. Bloki tekstu
- 4.1.3. Hiperłącza
- 4.1.4. Rysunki
- 4.1.5. Tabele
- 4.2. Wyświetlanie dokumentów w języku Markdown
- 4.1. Pisanie kodu w języku Markdown
- III. Podstawowe umiejętności z zakresu języka R
- 5. Wprowadzenie do języka R
- 5.1. Programowanie z użyciem języka R
- 5.2. Uruchamianie kodu w języku R
- 5.2.1. Używanie środowiska RStudio
- 5.2.2. Używanie języka R w wierszu poleceń
- 5.3. Dodawanie komentarzy
- 5.4. Definiowanie zmiennych
- 5.4.1. Podstawowe typy danych
- 5.5. Szukanie pomocy
- 5.5.1. Nauka uczenia się języka R
- 6. Funkcje
- 6.1. Czym jest funkcja?
- 6.1.1. Składnia funkcji w języku R
- 6.2. Wbudowane funkcje języka R
- 6.2.1. Argumenty nazwane
- 6.3. Wczytywanie funkcji
- 6.4. Pisanie funkcji
- 6.4.1. Debugowanie funkcji
- 6.5. Instrukcje warunkowe
- 6.1. Czym jest funkcja?
- 7. Wektory
- 7.1. Czym jest wektor?
- 7.1.1. Tworzenie wektorów
- 7.2. Operacje wektorowe
- 7.2.1. Ponowne używanie elementów
- 7.2.2. Prawie wszystko jest wektorem
- 7.2.3. Funkcje wektorowe
- 7.3. Indeksy w wektorach
- 7.3.1. Listy indeksów
- 7.4. Filtrowanie wektorów
- 7.5. Modyfikowanie wektorów
- 7.1. Czym jest wektor?
- 8. Listy
- 8.1. Czym jest lista?
- 8.2. Tworzenie list
- 8.3. Dostęp do elementów listy
- 8.4. Modyfikowanie list
- 8.4.1. Pojedyncze i podwójne nawiasy kwadratowe
- 8.5. Stosowanie funkcji do list za pomocą wywołania lapply()
- IV> Przekształcanie danych
- 9. Jak zrozumieć dane?
- 9.1. Proces generowania danych
- 9.2. Wyszukiwanie danych
- 9.3. Rodzaje danych
- 9.3.1. Skale pomiarowe
- 9.3.2. Struktury danych
- 9.4. Interpretowanie danych
- 9.4.1. Zdobywanie wiedzy w danej dziedzinie
- 9.4.2. Jak zrozumieć schematy danych?
- 9.5. Odpowiadanie na pytania na podstawie danych
- 10. Ramki danych
- 10.1. Czym jest ramka danych?
- 10.2. Praca z ramkami danych
- 10.2.1. Tworzenie ramek danych
- 10.2.2. Opisywanie struktury ramek danych
- 10.2.3. Dostęp do ramek danych
- 10.3. Praca z danymi CSV
- 10.3.1. Katalog roboczy
- 10.3.2. Zmienne w postaci faktorów
- 11. Operowanie danymi za pomocÄ… pakietu dplyr
- 11.1. Gramatyka operowania danymi
- 11.2. Podstawowe funkcje pakietu dplyr
- 11.2.1. Pobieranie (funkcja select())
- 11.2.2. Filtrowanie (funkcja filter())
- 11.2.3. Dodawanie kolumn (funkcja mutate())
- 11.2.4. Sortowanie danych (funkcja arrange())
- 11.2.5. Tworzenie podsumowań (funkcja summarize())
- 11.3. Wykonywanie operacji sekwencyjnych
- 11.3.1. Operator potoku
- 11.4. Analizowanie ramek danych z wykorzystaniem grupowania
- 11.5. ZÅ‚Ä…czanie ramek danych
- 11.6. Pakiet dplyr w praktyce analizowanie danych na temat lotów
- 12. PorzÄ…dkowanie danych za pomocÄ… pakietu tidyr
- 12.1. Czym jest porzÄ…dkowanie danych?
- 12.2. Od kolumn do wierszy gather()
- 12.3. Z wierszy na kolumny spread()
- 12.4. Pakiet tidyr w praktyce eksplorowanie statystyk na temat edukacji
- 13. Dostęp do bazy danych
- 13.1. PrzeglÄ…d relacyjnych baz danych
- 13.1.1. Czym jest relacyjna baza danych?
- 13.1.2. Tworzenie relacyjnej bazy danych
- 13.2. Wstęp do języka SQL
- 13.3. Dostęp do bazy danych w języku R
- 13.1. PrzeglÄ…d relacyjnych baz danych
- 14. Używanie internetowych interfejsów API
- 14.1. Czym jest internetowy interfejs API?
- 14.2. Żądania REST
- 14.2.1. Identyfikatory URI
- 14.2.1.1. Parametry zapytań
- 14.2.1.2. Tokeny dostępu i klucze API
- 14.2.2. Operacje (czasowniki) z protokołu HTTP
- 14.2.1. Identyfikatory URI
- 14.3. Dostęp do internetowych interfejsów API w R
- 14.4. Przetwarzanie danych w formacie JSON
- 14.4.1. Przetwarzanie danych w formacie JSON
- 14.4.2. Spłaszczanie danych
- 14.5. Interfejsy API w praktyce znajdowanie kubańskiego jedzenia w Seattle
- V. Wizualizacje danych
- 15. Projektowanie wizualizacji danych
- 15.1. Cel wizualizacji
- 15.2.Wybieranie układu graficznego
- 15.2.1. Wizualizowanie jednej zmiennej
- 15.2.1.1. Reprezentacje proporcjonalne
- 15.2.2. Wizualizowanie wielu zmiennych
- 15.2.3. Wizualizowanie danych hierarchicznych
- 15.2.1. Wizualizowanie jednej zmiennej
- 15.3. Wybieranie skutecznego kodowania graficznego
- 15.3.1. Skuteczne kolory
- 15.3.2. Wykorzystanie atrybutów przeduwagowych
- 15.4. Ekspresywne prezentacje danych
- 15.5. Zwiększanie estetyki
- 16. Tworzenie wizualizacji za pomocÄ… pakietu ggplot2
- 16.1. Gramatyka grafiki
- 16.2. Tworzenie podstawowych wykresów za pomocą ggplot2
- 16.2.1. Określanie obiektów geometrycznych
- 16.2.2. Odwzorowania aspektów estetycznych
- 16.3. Złożone układy i dostosowywanie opcji
- 16.3.1. Dostosowywanie pozycji
- 16.3.2. Zmienianie stylu za pomocÄ… skal
- 16.3.2.1. Skale kolorów
- 16.3.3. Układ współrzędnych
- 16.3.4. Fasety
- 16.3.5. Etykiety i uwagi
- 16.4. Tworzenie map
- 16.4.1. Kartogramy
- 16.4.2. Mapy punktowe
- 16.5. Pakiet ggplot2 w praktyce mapa eksmisji w San Francisco
- 17. Interaktywne wizualizacje w języku R
- 17.1. Pakiet plotly
- 17.2. Pakiet rbokeh
- 17.3. Pakiet leaflet
- 17.4. Interaktywne wizualizacje w praktyce analizowanie zmian w Seattle
- VI. Tworzenie i udostępnianie aplikacji
- 18. Tworzenie dynamicznych raportów za pomocą platformy R Markdown
- 18.1. Konfigurowanie raportu
- 18.1.1. Tworzenie plików .rmd
- 18.1.2. Kompilowanie dokumentów
- 18.2. Integrowanie tekstu w formacie Markdown i kodu w języku R
- 18.2.1. Wykonywalne fragmenty kodu w języku R
- 18.2.2. Kod wewnÄ…trzwierszowy
- 18.3. Wyświetlanie danych i wizualizacji w raportach
- 18.3.1. Wyświetlanie łańcuchów znaków
- 18.3.2. Wyświetlanie list w formacie Markdown
- 18.3.3. Wyświetlanie tabel
- 18.3.4. Wyświetlanie wykresów
- 18.4. Udostępnianie raportów jako stron internetowych
- 18.5. Platforma R Markdown w praktyce raport na temat oczekiwanej długości życia
- 18.1. Konfigurowanie raportu
- 19. Tworzenie interaktywnych aplikacji internetowych za pomocÄ… platformy Shiny
- 19.1. Platforma Shiny
- 19.1.1. Podstawowe zagadnienia dotyczÄ…ce platformy Shiny
- 19.1.2. Struktura aplikacji
- 19.2. Projektowanie interfejsów użytkownika
- 19.2.1. Treści statyczne
- 19.2.2. Dynamiczne dane wejściowe
- 19.2.3. Dynamiczne dane wyjściowe
- 19.2.4. Układy
- 19.3. Tworzenie serwerów aplikacji
- 19.4. Publikowanie aplikacji na platformÄ™ Shiny
- 19.5. Platforma Shiny w praktyce wizualizacja śmiertelnych postrzeleń przez policję
- 19.1. Platforma Shiny
- 20. Praca zespołowa
- 20.1. Śledzenie różnych wersji kodu za pomocą gałęzi
- 20.1.1. Praca z różnymi gałęziami
- 20.1.2. Scalanie gałęzi
- 20.1.3. Scalanie a konflikty
- 20.1.4. Scalanie w serwisie GitHub
- 20.2. Prowadzenie projektów z użyciem gałęzi funkcji
- 20.3. Współpraca w ramach scentralizowanego procesu pracy
- 20.3.1. Tworzenie centralnego repozytorium
- 20.3.2. Używanie gałęzi funkcji w scentralizowanym procesie pracy
- 20.4. Współpraca w procesie pracy z użyciem forków
- 20.1. Śledzenie różnych wersji kodu za pomocą gałęzi
- 21. Dalsza nauka
- 21.1. Uczenie statystyczne
- 21.1.1. Ocena zależności
- 21.1.2. Prognozowanie
- 21.2. Inne języki programowania
- 21.3. Odpowiedzialność etyczna
- 21.1. Uczenie statystyczne