Python i praca z danymi. Przetwarzanie, analiza, modelowanie i wizualizacja. Wydanie III - Helion


MIEJSCE 12 na liście TOP 20
Autor: Avinash Navlani, Armando Fandango, Ivan IdrisTytuł oryginału: Python Data Analysis: Perform data collection, data processing, wrangling, visualization, and model building using Python, 3rd Edition
Tłumaczenie: Krzysztof Sawka
ISBN: 978-83-283-8360-9
stron: 384, Format: 168x237, okładka: mi
Data wydania: 2022-04-01
Księgarnia: Helion
Cena książki: 62,30 zł (poprzednio: 89,00 zł)
Oszczędzasz: 30% (-26,70 zł)
Tagi: Python - Programowanie
Osoby które kupowały "Python i praca z danymi. Przetwarzanie, analiza, modelowanie i wizualizacja. Wydanie III", wybierały także:
- Flask. Kurs video. Od pierwszej linijki kodu do praktycznego zastosowania 119,00 zł, (47,60 zł -60%)
- Python. Kurs video. Programowanie asynchroniczne 97,32 zł, (39,90 zł -59%)
- Algorytmy i struktury danych. Kurs video. Java, JavaScript, Python 89,00 zł, (40,05 zł -55%)
- Data Science w Pythonie. Kurs video. Przetwarzanie i analiza danych 149,00 zł, (67,05 zł -55%)
- Python dla dzieci i młodzieży. Kurs video. Jak uczyć się programowania - pierwsze kroki 39,89 zł, (17,95 zł -55%)
Spis treści
Python i praca z danymi. Przetwarzanie, analiza, modelowanie i wizualizacja. Wydanie III -- spis tre¶ci
Wspó³autorzy
Wstêp
Czê¶æ I. Podstawy analizy danych
- Rozdzia³ 1. Wprowadzenie do bibliotek Pythona
- Wyja¶nienie pojêcia "analiza danych"
- Standardowy proces analizy danych
- Proces KDD
- Proces SEMMA
- Proces CRISP-DM
- Analiza danych a danetyka
- Umiejêtno¶ci analityka danych oraz danetyka
- Instalacja ¶rodowiska Python 3
- Oprogramowanie u¿ywane w tej ksi±¿ce
- U¿ywanie aplikacji IPython jako pow³oki
- Korzystanie z aplikacji JupyterLab
- Stosowanie aplikacji Jupyter Notebook
- Zaawansowane funkcje aplikacji Jupyter Notebook
- Podsumowanie
- Rozdzia³ 2. Biblioteki NumPy i pandas
- Wymogi techniczne
- Tablice NumPy
- Numeryczne typy danych tablic NumPy
- Manipulowanie wymiarami tablic
- £±czenie tablic NumPy
- Rozdzielanie tablic NumPy
- Zmiana typu danych tablic NumPy
- Tworzenie widoków i kopii NumPy
- Fragmentowanie tablic NumPy
- Indeksowanie logiczne i indeksowanie specjalne
- Rozg³aszanie tablic
- Tworzenie obiektów DataFrame biblioteki pandas
- Obiekt Series biblioteki pandas
- Odczytywanie i kwerendowanie danych Quandl
- Opisywanie obiektów DataFrame
- Grupowanie i z³±czanie obiektów DataFrame
- Praca z brakuj±cymi danymi
- Tworzenie tabel przestawnych
- Rozwi±zywanie kwestii dat
- Podsumowanie
- Bibliografia
- Rozdzia³ 3. Statystyka
- Wymogi techniczne
- Atrybuty i ich typy
- Pomiar tendencji centralnej
- Pomiar dyspersji
- Sko¶no¶æ i kurtoza
- Okre¶lanie zwi±zków za pomoc± wspó³czynników kowariancji i korelacji
- Centralne twierdzenie graniczne
- Pozyskiwanie prób
- Przeprowadzanie testów parametrycznych
- Przeprowadzanie testów nieparametrycznych
- Podsumowanie
- Rozdzia³ 4. Algebra liniowa
- Wymogi techniczne
- Dopasowywanie do wielomianów za pomoc± biblioteki NumPy
- Wyznacznik macierzy
- Okre¶lanie rzêdu macierzy
- Macierz odwrotna w bibliotece NumPy
- Rozwi±zywanie równañ liniowych za pomoc± biblioteki NumPy
- Rozk³ad macierzy za pomoc± SVD
- Warto¶ci w³asne i wektory w³asne w bibliotece NumPy
- Generowanie liczb losowych
- Rozk³ad dwumianowy
- Rozk³ad normalny
- Testowanie normalno¶ci rozk³adu danych za pomoc± biblioteki SciPy
- Tworzenie tablicy maskowanej za pomoc± podpakietu numpy.ma
- Podsumowanie
Czê¶æ II. Eksploracyjna analiza danych i oczyszczanie danych
- Rozdzia³ 5. Wizualizacja danych
- Wymogi techniczne
- Wizualizacja za pomoc± pakietu Matplotlib
- Zaawansowana wizualizacja za pomoc± pakietu seaborn
- Wizualizacja interaktywna za pomoc± biblioteki Bokeh
- Podsumowanie
- Rozdzia³ 6. Pozyskiwanie, przetwarzanie i przechowywanie danych
- Wymogi techniczne
- Odczyt i zapis plików CSV za pomoc± biblioteki NumPy
- Odczyt i zapis plików CSV za pomoc± biblioteki pandas
- Odczyt i zapis plików arkusza kalkulacyjnego Excel
- Odczyt i zapis plików JSON
- Odczyt i zapis plików HDF5
- Odczyt i zapis danych z tabel HTML-a
- Odczyt i zapis plików Parquet
- Odczyt i zapis danych z obiektu pickle
- £atwy dostêp do danych za pomoc± modu³u sqlite3
- Odczyt i zapis danych w bazie danych MySQL
- Odczyt i zapis danych w bazie danych MongoDB
- Odczyt i zapis danych w bazie danych Cassandra
- Odczyt i zapis danych w bazie danych Redis
- PonyORM
- Podsumowanie
- Rozdzia³ 7. Oczyszczanie nieuporz±dkowanych danych
- Wymogi techniczne
- Eksploracja danych
- Filtrowanie danych w celu pozbycia siê szumu
- Rozwi±zywanie kwestii brakuj±cych warto¶ci
- Rozwi±zywanie kwestii elementów odstaj±cych
- Techniki kodowania cech
- Skalowanie cech
- Przekszta³canie cech
- Rozdzielanie cech
- Podsumowanie
- Rozdzia³ 8. Przetwarzanie sygna³ów i szeregi czasowe
- Wymogi techniczne
- Modu³ statsmodels
- ¦rednie krocz±ce
- Funkcje okna czasowego
- Kointegracja
- Rozk³ad STL
- Autokorelacja
- Modele autoregresyjne
- Model ARMA
- Generowanie sygna³ów okresowych
- Analiza Fouriera
- Filtrowanie metod± analizy widmowej
- Podsumowanie
Czê¶æ III. Dok³adna analiza uczenia maszynowego
- Rozdzia³ 9. Uczenie nadzorowane: analiza regresyjna
- Wymogi techniczne
- Regresja liniowa
- Wielowspó³liniowo¶æ
- Zmienne fikcyjne
- Projektowanie modelu regresji liniowej
- Ocenianie skuteczno¶ci modelu regresyjnego
- Dopasowywanie regresji wielomianowej
- Modele regresji u¿ywane w klasyfikacji
- Regresja logistyczna
- Implementacja regresji logistycznej za pomoc± biblioteki scikit-learn
- Podsumowanie
- Rozdzia³ 10. Uczenie nadzorowane: techniki klasyfikacji
- Wymogi techniczne
- Klasyfikacja
- Naiwny klasyfikator Bayesa
- Drzewa decyzyjne
- Algorytm KNN
- Maszyny wektorów no¶nych
- Podzia³ danych na zestawy ucz±cy i testowy
- Ocena skuteczno¶ci modelu klasyfikacji
- Krzywa ROC i obszar AUC
- Podsumowanie
- Rozdzia³ 11. Uczenie nienadzorowane: PCA i analiza skupieñ
- Wymogi techniczne
- Uczenie nienadzorowane
- Redukowanie wymiarowo¶ci danych
- Analiza g³ównych sk³adowych
- Analiza skupieñ
- Grupowanie danych za pomoc± algorytmu centroidów
- Hierarchiczna analiza skupieñ
- Algorytm DBSCAN
- Widmowa analiza skupieñ
- Ocenianie jako¶ci analizy skupieñ
- Podsumowanie
Czê¶æ IV. Przetwarzanie jêzyka naturalnego, analiza obrazów i obliczenia równoleg³e
- Rozdzia³ 12. Analiza danych tekstowych
- Wymogi techniczne
- Instalacja bibliotek NLTK i spaCy
- Normalizacja tekstu
- Tokenizacja
- Usuwanie s³ów nieinformatywnych
- Rdzeniowanie s³ów i lematyzacja
- Oznaczanie czê¶ci mowy
- Rozpoznawanie jednostek nazewniczych
- Analiza zale¿no¶ci
- Tworzenie chmury s³ów
- "Worek s³ów"
- Metoda TF-IDF
- Analiza sentymentów za pomoc± klasyfikacji tekstu
- Podobieñstwo tekstów
- Podsumowanie
- Rozdzia³ 13. Analiza obrazów
- Wymogi techniczne
- Instalacja biblioteki OpenCV
- Omówienie danych obrazowych
- Modele barw
- Rysowanie na obrazach
- Pisanie na obrazach
- Zmiana rozmiaru obrazu
- Przekszta³cenie izometryczne obrazów
- Zmiana jasno¶ci
- Rozmywanie obrazu
- Wykrywanie twarzy
- Podsumowanie
- Rozdzia³ 14. Obliczenia równoleg³e za pomoc± biblioteki Dask
- Obliczenia równoleg³e za pomoc± biblioteki Dask
- Typy danych Dask
- Interfejs Dask Delayed
- Skalowane wstêpne przetwarzanie danych
- Skalowane uczenie maszynowe
- Podsumowanie