reklama - zainteresowany?

Python w analizie danych. Przetwarzanie danych za pomocą pakietów Pandas i NumPy oraz środowiska IPython. Wydanie II - Helion

Python w analizie danych. Przetwarzanie danych za pomocą pakietów Pandas i NumPy oraz środowiska IPython. Wydanie II
ebook
Autor: Wes McKinney
Tytuł oryginału: Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, 2nd Edition
Tłumaczenie: Konrad Matuk
ISBN: 978-83-283-4082-4
stron: 480, Format: ebook
Data wydania: 2018-06-01
Księgarnia: Helion

Cena książki: 66,75 zł (poprzednio: 89,00 zł)
Oszczędzasz: 25% (-22,25 zł)

Dodaj do koszyka Python w analizie danych. Przetwarzanie danych za pomocą pakietów Pandas i NumPy oraz środowiska IPython. Wydanie II

Tagi: Python - Programowanie

Analiza danych stała się samodzielną dyscypliną wiedzy interesującą specjalistów z wielu branż: analityków biznesowych, statystyków, architektów oprogramowania czy też osoby zajmujące się sztuczną inteligencją. Wydobywanie informacji ze zbiorów danych pozwala na uzyskanie wiedzy niedostępnej w inny sposób. W tym celu dane trzeba odpowiednio przygotować, oczyścić, przetworzyć i oczywiście poddać analizie. Warto również zadbać o ich wizualizację. Do tych wszystkich zadań najlepiej wykorzystać specjalne narzędzia opracowane w języku Python.

Prezentowana książka jest drugim, zaktualizowanym i uzupełnionym, wydaniem klasycznego podręcznika napisanego z myślą o analitykach, którzy dotychczas nie pracowali w Pythonie, oraz o programistach Pythona, którzy nie zajmowali się dotąd analizą danych ani obliczeniami naukowymi. Przedstawiono tu możliwości oferowane przez Pythona 3.6 oraz najnowsze funkcje pakietów Pandas i NumPy, a także środowisk IPython i Jupyter. Przy opisie poszczególnych narzędzi analitycznych wyjaśniono ich działanie i zaprezentowano przykłady ich wykorzystania w sposób efektywny i kreatywny. Ta książka powinna się znaleźć w podręcznej bibliotece każdego analityka danych!

Najważniejsze zagadnienia:

  • Eksploracja danych za pomocą powłoki IPython i środowiska Jupyter
  • Korzystanie z pakietów NumPy i Pandas
  • Tworzenie wizualizacji danych za pomocą pakietu Matplotlib
  • Praca z danymi regularnych i nieregularnych szeregów czasowych
  • Rozwiązywanie rzeczywistych problemów analitycznych

Python: poznaj idealne narzędzie do analizy danych!


Wes McKinney jest świetnie znany jako twórca pakietu Pandas - popularnej otwartej biblioteki Pythona przeznaczonej do analizy danych. Zajmuje się językami Python i C++. Jest związany ze środowiskiem analityków pracujących w Pythonie i z Apache Software Foundation, z którą rozwija wiele ciekawych projektów. Obecnie pracuje w Nowym Jorku jako architekt oprogramowania. McKinney często występuje w roli prelegenta na różnych konferencjach. Uwielbia podróże, interesuje się lingwistyką i językami obcymi.

Dodaj do koszyka Python w analizie danych. Przetwarzanie danych za pomocą pakietów Pandas i NumPy oraz środowiska IPython. Wydanie II

 

Osoby które kupowały "Python w analizie danych. Przetwarzanie danych za pomocą pakietów Pandas i NumPy oraz środowiska IPython. Wydanie II", wybierały także:

  • Złam ten kod z Pythonem. Jak tworzyć, testować i łamać szyfry
  • Flask. Kurs video. Od pierwszej linijki kodu do praktycznego zastosowania
  • Python. Kurs video. Programowanie asynchroniczne
  • Python dla zaawansowanych. Kurs video. Podnie
  • Python dla administrator

Dodaj do koszyka Python w analizie danych. Przetwarzanie danych za pomocą pakietów Pandas i NumPy oraz środowiska IPython. Wydanie II

Spis treści

Python w analizie danych. Przetwarzanie danych za pomoc pakietw Pandas i NumPy oraz rodowiska IPython. Wydanie II eBook -- spis treci

Przedmowa (11)

1. Wstp (15)

  • 1.1. O czym jest ta ksika? (15)
    • Jakie rodzaje danych? (15)
  • 1.2. Dlaczego warto korzysta z Pythona w celu przeprowadzenia analizy danych? (16)
    • Python jako spoiwo (16)
    • Rozwizywanie problemu "dwujzycznoci" (17)
    • Dlaczego nie Python? (17)
  • 1.3. Podstawowe biblioteki Pythona (17)
    • NumPy (18)
    • pandas (18)
    • Matplotlib (19)
    • IPython i Jupyter (19)
    • SciPy (20)
    • Scikit-learn (21)
    • statsmodels (21)
  • 1.4. Instalacja i konfiguracja (22)
    • Windows (22)
    • Apple (OS X, macOS) (23)
    • GNU, Linux (23)
    • Instalowanie i aktualizowanie pakietów Pythona (24)
    • Python 2 i Python 3 (24)
    • Zintegrowane rodowiska programistyczne i edytory tekstowe (25)
  • 1.5. Spoeczno i konferencje (25)
  • 1.6. Nawigacja po ksice (26)
    • Przykady kodu (27)
    • Przykadowe dane (27)
    • Konwencje importowania (27)
    • argon (27)

2. Podstawy Pythona oraz obsugi narzdzi IPython i Jupyter (29)

  • 2.1. Interpreter Pythona (30)
  • 2.2. Podstawy interpretera IPython (31)
    • Uruchamianie powoki IPython (31)
    • Uruchamianie notatnika Jupyter Notebook (32)
    • Uzupenianie polece (35)
    • Introspekcja (36)
    • Polecenie %run (37)
    • Wykonywanie kodu ze schowka (39)
    • Skróty klawiaturowe dziaajce w terminalu (39)
    • Polecenia magiczne (40)
    • Integracja pakietu matplotlib (42)
  • 2.3. Podstawy Pythona (42)
    • Semantyka jzyka Python (43)
    • Skalarne typy danych (50)
    • Przepyw sterowania (57)

3. Wbudowane struktury danych, funkcje i pliki (61)

  • 3.1. Struktury danych i sekwencje (61)
    • Krotka (61)
    • Lista (64)
    • Wbudowane funkcje obsugujce sekwencje (68)
    • Sownik (70)
    • Zbiór (73)
    • Lista, sownik i zbiór - skadanie (75)
  • 3.2. Funkcje (77)
    • Przestrzenie nazw, zakres i funkcje lokalne (78)
    • Zwracanie wielu wartoci (79)
    • Funkcje s obiektami (79)
    • Funkcje anonimowe (lambda) (81)
    • Currying - czciowa aplikacja argumentów (82)
    • Generatory (82)
    • Bdy i obsuga wyjtków (84)
  • 3.3. Pliki i system operacyjny (86)
    • Bajty i kodowanie Unicode w plikach (89)
  • 3.4. Podsumowanie (91)

4. Podstawy biblioteki NumPy: obsuga tablic i wektorów (93)

  • 4.1. NumPy ndarray - wielowymiarowy obiekt tablicowy (95)
    • Tworzenie tablic ndarray (96)
    • Typ danych tablic ndarray (98)
    • Dziaania matematyczne z tablicami NumPy (100)
    • Podstawy indeksowania i przechwytywania czci (101)
    • Indeksowanie i wartoci logiczne (105)
    • Indeksowanie specjalne (108)
    • Transponowanie tablic i zamiana osi (109)
  • 4.2. Funkcje uniwersalne - szybkie funkcje wykonywane na poszczególnych elementach tablicy (110)
  • 4.3. Programowanie z uyciem tablic (113)
    • Logiczne operacje warunkowe jako operacje tablicowe (115)
    • Metody matematyczne i statystyczne (116)
    • Metody tablic logicznych (117)
    • Sortowanie (118)
    • Wartoci unikalne i operacje logiczne (119)
  • 4.4. Tablice i operacje na plikach (120)
  • 4.5. Algebra liniowa (120)
  • 4.6. Generowanie liczb pseudolosowych (122)
  • 4.7. Przykad: bdzenie losowe (124)
    • Jednoczesne symulowanie wielu bdze losowych (125)
  • 4.8. Podsumowanie (126)

5. Rozpoczynamy prac z bibliotek pandas (127)

  • 5.1. Wprowadzenie do struktur danych biblioteki pandas (127)
    • Obiekt Series (128)
    • Obiekt DataFrame (131)
    • Obiekty index (137)
  • 5.2. Podstawowe funkcjonalnoci (139)
    • Uaktualnianie indeksu (139)
    • Odrzucanie elementów osi (141)
    • Indeksowanie, wybieranie i filtrowanie (143)
    • Indeksy w postaci liczb cakowitych (147)
    • Dziaania arytmetyczne i wyrównywanie danych (148)
    • Funkcje apply i map (153)
    • Sortowanie i tworzenie rankingów (154)
    • Indeksy osi ze zduplikowanymi etykietami (157)
  • 5.3. Podsumowywanie i generowanie statystyk opisowych (158)
    • Wspóczynnik korelacji i kowariancja (161)
    • Unikalne wartoci, ich liczba i przynaleno (163)
  • 5.4. Podsumowanie (165)

6. Odczyt i zapis danych, formaty plików (167)

  • 6.1. Odczyt i zapis danych w formacie tekstowym (167)
    • Wczytywanie czci pliku tekstowego (173)
    • Zapis danych w formacie tekstowym (174)
    • Praca z plikami danych rozgraniczonych (176)
    • Dane w formacie JSON (178)
    • XML i HTML - web scraping (179)
  • 6.2. Formaty danych binarnych (182)
    • Obsuga formatu HDF5 (183)
    • Wczytywanie plików programu Microsoft Excel (185)
  • 6.3. Obsuga interfejsów sieciowych (186)
  • 6.4. Obsuga baz danych (187)
  • 6.5. Podsumowanie (188)

7. Czyszczenie i przygotowywanie danych (189)

  • 7.1. Obsuga brakujcych danych (189)
    • Filtrowanie brakujcych danych (191)
    • Wypenianie brakujcych danych (193)
  • 7.2. Przeksztacanie danych (195)
    • Usuwanie duplikatów (195)
    • Przeksztacanie danych przy uyciu funkcji lub mapowania (196)
    • Zastpowanie wartoci (197)
    • Zmiana nazw indeksów osi (199)
    • Dyskretyzacja i podzia na koszyki (200)
    • Wykrywanie i filtrowanie elementów odstajcych (202)
    • Permutacje i próbkowanie losowe (203)
    • Przetwarzanie wskaników i zmiennych zastpczych (204)
  • 7.3. Operacje przeprowadzane na acuchach (207)
    • Metody obiektu typu string (207)
    • Wyraenia regularne (209)
    • Wektoryzacja funkcji acuchów w pakiecie pandas (212)
  • 7.4. Podsumowanie (215)

8. Przetwarzanie danych - operacje czenia, wizania i przeksztacania (217)

  • 8.1. Indeksowanie hierarchiczne (217)
    • Zmiana kolejnoci i sortowanie poziomów (220)
    • Parametry statystyki opisowej z uwzgldnieniem poziomu (220)
    • Indeksowanie z kolumnami ramki danych (221)
  • 8.2. czenie zbiorów danych (222)
    • czenie ramek danych w stylu czenia elementów baz danych (222)
    • czenie przy uyciu indeksu (227)
    • Konkatenacja wzdu osi (230)
    • czenie czciowo nakadajcych si danych (234)
  • 8.3. Zmiana ksztatu i operacje osiowe (235)
    • Przeksztacenia z indeksowaniem hierarchicznym (236)
    • Przeksztacanie z formatu "dugiego" na "szeroki" (238)
    • Przeksztacanie z formatu "szerokiego" na "dugi" (241)
  • 8.4. Podsumowanie (243)

9. Wykresy i wizualizacja danych (245)

  • 9.1. Podstawy obsugi interfejsu pakietu matplotlib (245)
    • Obiekty figure i wykresy skadowe (246)
    • Kolory, oznaczenia i style linii (250)
    • Punkty, etykiety i legendy (252)
    • Adnotacje i rysunki (255)
    • Zapisywanie wykresów w postaci plików (257)
    • Konfiguracja pakietu matplotlib (258)
  • 9.2. Generowanie wykresów za pomoc pakietów pandas i seaborn (259)
    • Wykresy liniowe (259)
    • Wykresy supkowe (262)
    • Histogramy i wykresy gstoci (266)
    • Wykresy punktowe (268)
    • Wykresy panelowe i dane kategoryczne (269)
  • 9.3. Inne narzdzia przeznaczone do wizualizacji danych w Pythonie (272)
  • 9.4. Podsumowanie (272)

10. Agregacja danych i operacje wykonywane na grupach (273)

  • 10.1. Mechanika interfejsu groupby (274)
    • Iteracja po grupach (277)
    • Wybieranie kolumny lub podzbioru kolumn (278)
    • Grupowanie przy uyciu sowników i serii (279)
    • Grupowanie przy uyciu funkcji (280)
    • Grupowanie przy uyciu poziomów indeksu (280)
  • 10.2. Agregacja danych (281)
    • Przetwarzanie kolumna po kolumnie i stosowanie wielu funkcji (282)
    • Zwracanie zagregowanych danych bez indeksów wierszy (285)
  • 10.3. Metoda apply - ogólne zastosowanie techniki dziel-zastosuj-pocz (286)
    • Usuwanie kluczy grup (288)
    • Kwantyle i analiza koszykowa (288)
    • Przykad: wypenianie brakujcych wartoci przy uyciu wartoci charakterystycznych dla grupy (290)
    • Przykad: losowe generowanie próbek i permutacja (292)
    • Przykad: rednie waone grup i wspóczynnik korelacji (293)
    • Przykad: regresja liniowa grup (295)
  • 10.4. Tabele przestawne i krzyowe (295)
    • Tabele krzyowe (298)
  • 10.5. Podsumowanie (299)

11. Szeregi czasowe (301)

  • 11.1. Typy danych i narzdzia przeznaczone do obsugi daty i czasu (302)
    • Konwersja pomidzy obiektami string i datetime (303)
  • 11.2. Podstawy szeregów czasowych (305)
    • Indeksowanie i wybieranie (306)
    • Szeregi czasowe z duplikatami indeksów (309)
  • 11.3. Zakresy dat, czstotliwoci i przesunicia (310)
    • Generowanie zakresów dat (310)
    • Czstotliwoci i przesunicia daty (313)
    • Przesuwanie daty (314)
  • 11.4. Obsuga strefy czasowej (317)
    • Lokalizacja i konwersja stref czasowych (317)
    • Operacje z udziaem obiektów Timestamp o wyznaczonej strefie czasowej (319)
    • Operacje pomidzy rónymi strefami czasowymi (320)
  • 11.5. Okresy i przeprowadzanie na nich operacji matematycznych (321)
    • Konwersja czstotliwoci acuchów (322)
    • Kwartalne czstotliwoci okresów (323)
    • Konwersja znaczników czasu na okresy (i z powrotem) (325)
    • Tworzenie obiektów PeriodIndex na podstawie tablic (326)
  • 11.6. Zmiana rozdzielczoci i konwersja czstotliwoci (328)
    • Zmniejszanie czstotliwoci (329)
    • Zwikszanie rozdzielczoci i interpolacja (332)
    • Zmiana rozdzielczoci z okresami (333)
  • 11.7. Funkcje ruchomego okna (334)
    • Funkcje waone wykadniczo (337)
    • Binarne funkcje ruchomego okna (338)
    • Funkcje ruchomego okna definiowane przez uytkownika (340)
  • 11.8. Podsumowanie (340)

12. Zaawansowane funkcje biblioteki pandas (341)

  • 12.1. Dane kategoryczne (341)
    • Kontekst i motywacja (341)
    • Typ Categorical w bibliotece pandas (343)
    • Obliczenia na obiektach typu Categorical (345)
    • Metody obiektu kategorycznego (347)
  • 12.2. Zaawansowane operacje grupowania (349)
    • Transformacje grup i "nieobudowane" operacje grupowania (349)
    • Zmiana rozdzielczoci czasu przeprowadzana przy uyciu grup (353)
  • 12.3. Techniki czenia metod w acuch (354)
    • Metoda pipe (355)
  • 12.4. Podsumowanie (356)

13. Wprowadzenie do bibliotek modelujcych (357)

  • 13.1. czenie pandas z kodem modelu (357)
  • 13.2. Tworzenie opisów modeli przy uyciu biblioteki Patsy (360)
    • Przeksztacenia danych za pomoc formu Patsy (362)
    • Patsy i dane kategoryczne (363)
  • 13.3. Wprowadzenie do biblioteki statsmodels (366)
    • Szacowanie modeli liniowych (366)
    • Szacowanie procesów szeregów czasowych (369)
  • 13.4. Wprowadzenie do pakietu scikit-learn (369)
  • 13.5. Dalszy rozwój (373)

14. Przykady analizy danych (375)

  • 14.1. Dane USA.gov serwisu Bitly (375)
    • Liczenie stref czasowych w czystym Pythonie (376)
    • Liczenie stref czasowych przy uyciu pakietu pandas (378)
  • 14.2. Zbiór danych MovieLens 1M (384)
    • Wyznaczenie rozbienoci ocen (388)
  • 14.3. Imiona nadawane dzieciom w USA w latach 1880 - 2010 (389)
    • Analiza trendów imion (394)
  • 14.4. Baza danych USDA Food (402)
  • 14.5. Baza danych 2012 Federal Election Commission (406)
    • Statystyki datków z podziaem na wykonywany zawód i pracodawc (409)
    • Podzia kwot datków na koszyki (411)
    • Statystyki datków z podziaem na poszczególne stany (413)
  • 14.6. Podsumowanie (414)

A. Zaawansowane zagadnienia zwizane z bibliotek NumPy (415)

  • A.1. Szczegóy budowy obiektu ndarray (415)
    • Hierarchia typów danych NumPy (416)
  • A.2. Zaawansowane operacje tablicowe (417)
    • Zmiana wymiarów tablic (417)
    • Kolejnoci charakterystyczne dla jzyków C i Fortran (419)
    • czenie i dzielenie tablic (420)
    • Powtarzanie elementów - funkcje tile i repeat (422)
    • Alternatywy indeksowania specjalnego - metody take i put (423)
  • A.3. Rozgaszanie (424)
    • Rozgaszanie wzdu innych osi (426)
    • Przypisywanie wartoci elementom tablicy poprzez rozgaszanie (428)
  • A.4. Zaawansowane zastosowania funkcji uniwersalnych (429)
    • Metody instancji funkcji uniwersalnych (429)
    • Pisanie nowych funkcji uniwersalnych w Pythonie (431)
  • A.5. Tablice o zoonej strukturze (432)
    • Zagniedone typy danych i pola wielowymiarowe (433)
    • Do czego przydaj si tablice o zoonej strukturze? (434)
  • A.6. Jeszcze co o sortowaniu (434)
    • Sortowanie porednie - metody argsort i lexsort (435)
    • Alternatywne algorytmy sortowania (436)
    • Czciowe sortowanie tablic (437)
    • Wyszukiwanie elementów w posortowanej tablicy za pomoc metody numpy.searchsorted (438)
  • A.7. Pisanie szybkich funkcji NumPy za pomoc pakietu Numba (439)
    • Tworzenie obiektów numpy.ufunc za pomoc pakietu Numba (440)
  • A.8. Zaawansowane tablicowe operacje wejcia i wyjcia (441)
    • Pliki mapowane w pamici (441)
    • HDF5 i inne moliwoci zapisu tablic (442)
  • A.9. Jak zachowa wysok wydajno? (442)
    • Dlaczego warto korzysta z ssiadujcych ze sob obszarów pamici? (443)

B. Dodatkowe informacje dotyczce systemu IPython (445)

  • B.1. Korzystanie z historii polece (445)
    • Przeszukiwanie i korzystanie z historii polece (445)
    • Zmienne wejciowe i wyjciowe (446)
  • B.2. Interakcja z systemem operacyjnym (447)
    • Polecenia powoki systemowej i aliasy (447)
    • System tworzenia skrótów do katalogów (448)
  • B.3. Narzdzia programistyczne (449)
    • Interaktywny debuger (449)
    • Pomiar czasu - funkcje %time i %timeit (453)
    • Podstawowe profilowanie - funkcje %prun i %run-p (455)
    • Profilowanie funkcji linia po linii (457)
  • B.4. Wskazówki dotyczce produktywnego tworzenia kodu w rodowisku IPython (458)
    • Przeadowywanie moduów (459)
    • Wskazówki dotyczce projektowania kodu (460)
  • B.5. Zaawansowane funkcje rodowiska IPython (461)
    • Co zrobi, aby wasne klasy byy przyjazne dla systemu IPython? (461)
    • Profile i konfiguracja (462)

Skorowidz (465)

Dodaj do koszyka Python w analizie danych. Przetwarzanie danych za pomocą pakietów Pandas i NumPy oraz środowiska IPython. Wydanie II

Code, Publish & WebDesing by CATALIST.com.pl



(c) 2005-2023 CATALIST agencja interaktywna, znaki firmowe należą do wydawnictwa Helion S.A.