Pandas. Receptury. Obliczenia naukowe, szeregi czasowe i eksploracyjna analiza danych w Pythonie. Wydanie III - Helion

Tytuł oryginału: Pandas Cookbook: Practical recipes for scientific computing, time series, and exploratory data analysis using Python, 3rd Edition
Tłumaczenie: Robert G
ISBN: 978-83-289-3174-9
stron: 344, Format: ebook
Księgarnia: Helion
Cena książki: 89,00 zł
Książka będzie dostępna od listopada 2025
Zobacz także:
- Jak zhakowa 125,00 zł, (10,00 zł -92%)
- Blockchain i kryptowaluty. Kurs video. Zdecentralizowane finanse od podstaw 118,90 zł, (11,89 zł -90%)
- Web scraping. Kurs video. Zautomatyzowane pozyskiwanie danych z sieci 126,36 zł, (13,90 zł -89%)
- GraphQL. Kurs video. Buduj nowoczesne API w Pythonie 153,64 zł, (16,90 zł -89%)
- Windows Media Center. Domowe centrum rozrywki 66,67 zł, (8,00 zł -88%)
Spis treści
Pandas. Receptury. Obliczenia naukowe, szeregi czasowe i eksploracyjna analiza danych w Pythonie. Wydanie III eBook -- spis treści
O autorach
O korektorze merytorycznym
Wstęp
Wprowadzenie
Rozdział 1. Podstawy biblioteki pandas
- Importowanie biblioteki pandas
- Obiekt pd.Series
- Obiekt pd.DataFrame
- Obiekt pd.Index
- Atrybuty obiektu pd.Series
- Atrybuty obiektu pd.DataFrame
Rozdział 2. Wybieranie i przypisywanie wartości
- Podstawowe wybieranie wartości z obiektu pd.Series
- Podstawowe wybieranie wartości z obiektu pd.DataFrame
- Wybieranie wartości oparte na pozycji w obiekcie pd.Series
- Wybieranie wartości oparte na pozycji w obiekcie pd.DataFrame
- Wybieranie wartości oparte na etykietach w obiekcie pd.Series
- Wybieranie wartości oparte na etykietach w obiekcie pd.DataFrame
- Łączenie wyboru wartości opartego na pozycji i etykietach
- Metoda pd.DataFrame.filter
- Wybieranie wartości według ich typu
- Wybieranie i filtrowanie wartości za pomocą tablic logicznych
- Wybieranie wartości z obiektu pd.MultiIndex - jeden poziom
- Wybieranie wartości z obiektu pd.MultiIndex - wiele poziomów
- Wybieranie wartości z obiektu pd.MultiIndex - obiekt pd.DataFrame
- Przypisywanie elementów za pomocą metod .loc i .iloc
- Przypisywanie kolumn w obiekcie pd.DataFrame
Rozdział 3. Typy danych
- Typy całkowitoliczbowe
- Typy zmiennoprzecinkowe
- Typy logiczne
- Typy tekstowe
- Obsługa brakujących wartości
- Typy kategoryczne
- Typy czasowe - datetime
- Typy czasowe - timedelta
- Typy czasowe PyArrow
- Typy list PyArrow
- Typy dziesiętne PyArrow
- System typów NumPy, typ object i pułapki z nimi związane
Rozdział 4. System wejścia-wyjścia biblioteki pandas
- CSV - podstawy odczytu i zapisu
- CSV - strategie wczytywania dużych plików
- Microsoft Excel - podstawy odczytu i zapisu danych
- Microsoft Excel - wyszukiwanie tabel w niestandardowych lokalizacjach
- Microsoft Excel - dane hierarchiczne
- SQL z wykorzystaniem SQLAlchemy
- SQL z wykorzystaniem ADBC
- Apache Parquet
- JSON
- HTML
- Pickle
- Zewnętrzne biblioteki wejścia-wyjścia
Rozdział 5. Algorytmy i ich zastosowanie
- Podstawowe operacje arytmetyczne na obiektach pd.Series
- Podstawowe operacje arytmetyczne na obiektach pd.DataFrame
- Agregacje
- Transformacje
- Mapowanie
- Stosowanie funkcji
- Podsumowujące dane statystyczne
- Algorytmy grupowania
- Kodowanie "1 z n" za pomocą funkcji pd.get_dummies
- Łączenie operacji za pomocą metody .pipe
- Wybieranie filmów o najniższym budżecie z listy stu najlepszych
- Obliczanie ceny dla kroczącego zlecenia stop
- Wyszukiwanie najlepszych baseballistów
- Ustalanie pozycji zdobywającej najwięcej punktów dla drużyny
Rozdział 6. Wizualizacja
- Tworzenie wykresów na podstawie zagregowanych danych
- Wizualizacja rozkładów danych niezagregowanych
- Dostosowywanie do własnych potrzeb wykresów tworzonych za pomocą biblioteki Matplotlib
- Analiza wykresów punktowych
- Analiza danych kategorycznych
- Analiza danych ciągłych
- Wykorzystanie biblioteki seaborn do tworzenia zaawansowanych wykresów
Rozdział 7. Przekształcanie ramek danych
- Łączenie obiektów pd.DataFrame
- Łączenie ramek danych za pomocą pd.merge
- Łączenie ramek danych za pomocą pd.DataFrame.join
- Przekształcanie danych za pomocą pd.DataFrame.stack i pd.DataFrame.unstack
- Zmiana kształtu danych za pomocą pd.DataFrame.melt
- Przekształcanie danych za pomocą pd.wide_to_long
- Zmiana struktury danych za pomocą pd.DataFrame.pivot i pd.pivot_table
- Przekształcanie danych za pomocą pd.DataFrame.explode
- Transpozycja danych za pomocą pd.DataFrame.T
Rozdział 8. Grupowanie
- Podstawy grupowania
- Grupowanie i obliczenia na wielu kolumnach
- Grupowanie za pomocą funkcji apply
- Operacje na oknach
- Wybór najwyżej ocenianych filmów według roku
- Porównanie najlepszych pałkarzy w baseballu na przestrzeni lat
Rozdział 9. Algorytmy i typy danych czasowych
- Obsługa stref czasowych
- Przesunięcia dat
- Wybieranie daty i godziny
- Resampling
- Agregacja tygodniowych danych o przestępstwach i wypadkach drogowych
- Obliczanie rocznych zmian w kategoriach przestępstw
- Dokładny pomiar rejestrowanych przez czujniki zdarzeń, dla których brakuje wartości
Rozdział 10. Ogólne wskazówki dotyczące użytkowania i wydajności
- Unikaj użycia typu danych object
- Zwracaj uwagę na wielkość danych
- Używaj funkcji zwektoryzowanych zamiast pętli
- Unikaj modyfikowania danych
- Korzystaj ze słownika podczas pracy z danymi o niskiej liczbie unikalnych wartości
- Wykorzystuj techniki programowania sterowanego testami
Rozdział 11. Ekosystem biblioteki pandas
- Podstawowe biblioteki zewnętrzne
- NumPy
- PyArrow
- Eksploracyjna analiza danych
- YData Profiling
- Sprawdzanie poprawności danych
- Great Expectations
- Wizualizacja
- Plotly
- PyGWalker
- Nauka o danych
- scikit-learn
- XGBoost
- Bazy danych
- DuckDB
- Inne biblioteki przeznaczone do pracy z ramkami danych
- Ibis
- Dask
- Polars
- cuDF





