Data science i Python. Stawianie czo - Helion
ebook
Autor: Bradford TuckfieldTytuł oryginału: Dive Into Data Science: Use Python To Tackle Your Toughest Business Challenges
Tłumaczenie: Grzegorz Werner
ISBN: 978-83-289-1015-7
stron: 280, Format: ebook
Data wydania: 2024-06-25
Księgarnia: Helion
Cena książki: 34,50 zł (poprzednio: 69,00 zł)
Oszczędzasz: 50% (-34,50 zł)
Osoby które kupowały "Data science i Python. Stawianie czo", wybierały także:
- Superinteligencja. Scenariusze, strategie, zagro 66,67 zł, (14,00 zł -79%)
- Poradnik design thinking - czyli jak wykorzysta 48,28 zł, (14,00 zł -71%)
- Kosymulacja. Elastyczne projektowanie i symulacja wielodomenowa 38,39 zł, (11,90 zł -69%)
- F# 4.0 dla zaawansowanych. Wydanie IV 96,45 zł, (29,90 zł -69%)
- Systemy reaktywne. Wzorce projektowe i ich stosowanie 65,31 zł, (20,90 zł -68%)
Spis treści
Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym eBook -- spis treści
Podziękowania
Wprowadzenie
1. Eksploracyjna analiza danych
- Twój pierwszy dzień na stanowisku prezesa
- Znajdowanie wzorców w zbiorach danych
- Używanie plików .csv do przeglądania i przechowywania danych
- Wyświetlanie danych w Pythonie
- Obliczanie statystyk zbiorczych
- Analizowanie podzbiorów danych
- Dane nocne
- Dane sezonowe
- Wizualizacja danych za pomocą Matplotlib
- Rysowanie i wyświetlanie prostego wykresu
- Tytuły i etykiety na wykresach
- Kreślenie podzbiorów danych
- Testowanie różnych typów wykresów
- Eksplorowanie korelacji
- Obliczanie korelacji
- Silna i słaba korelacja
- Znajdowanie korelacji między zmiennymi
- Tworzenie map cieplnych
- Dalsza eksploracja
- Podsumowanie
2. Prognozowanie
- Przewidywanie popytu
- Oczyszczanie błędnych danych
- Kreślenie danych w celu odkrywania trendów
- Przeprowadzanie regresji liniowej
- Algebraiczne podstawy linii regresji
- Obliczanie miar błędu
- Używanie regresji do prognozowania przyszłych trendów
- Wypróbowywanie innych modeli regresji
- Przewidywanie sprzedaży z wykorzystaniem multiwariantnej regresji liniowej
- Oddawanie zmienności z wykorzystaniem trygonometrii
- Wybieranie najlepszej regresji na potrzeby prognozowania
- Dalsza eksploracja
- Podsumowanie
3. Porównywanie grup
- Dane dotyczące populacji
- Statystyki zbiorcze
- Próby losowe
- Różnice między próbami
- Testowanie hipotez
- Test t
- Niuanse testowania hipotez
- Porównywanie grup w kontekście praktycznym
- Podsumowanie
4. Testy A/B
- Potrzeba eksperymentowania
- Przeprowadzanie eksperymentów w celu testowania nowych hipotez
- Matematyka testów A/B
- Przekładanie matematyki na praktykę
- Optymalizacja z wykorzystaniem modelu mistrz - pretendent
- Zapobieganie pomyłkom z wykorzystaniem prawa Twymana i testów A/A
- Wielkości efektu
- Obliczanie istotności danych
- Zastosowania i kwestie zaawansowane
- Etyka testów A/B
- Podsumowanie
5. Klasyfikacja binarna
- Minimalizowanie odpływu klientów
- Używanie liniowych modeli prawdopodobieństwa do znajdowania klientów wysokiego ryzyka
- Wykres ryzyka odpływu
- Potwierdzanie zależności za pomocą regresji liniowej
- Przewidywanie przyszłości
- Dokonywanie rekomendacji biznesowych
- Mierzenie dokładności prognoz
- Multiwariantne modele LPM
- Tworzenie nowych miar
- Wady modeli LPM
- Przewidywanie binarnych wyników za pomocą regresji logistycznej
- Rysowanie krzywych logistycznych
- Dopasowywanie krzywej logistycznej do danych
- Zastosowania klasyfikacji binarnej
- Podsumowanie
6. Uczenie nadzorowane
- Przewidywanie ruchu w witrynie internetowej
- Wczytywanie i wykreślanie danych dotyczących artykułów
- Używanie regresji liniowej jako metody przewidywania
- Uczenie nadzorowane
- Metoda k najbliższych sąsiadów
- Implementowanie metody k-NN
- Analiza k-NN z wykorzystaniem pakietu sklearn
- Używanie innych algorytmów uczenia nadzorowanego
- Drzewa decyzyjne
- Lasy losowe
- Sieci neuronowe
- Mierzenie dokładności prognoz
- Praca z modelami multiwariantnymi
- Używanie klasyfikacji zamiast regresji
- Podsumowanie
7. Uczenie nienadzorowane
- Uczenie nadzorowane a uczenie nienadzorowane
- Generowanie i eksplorowanie danych
- Rzucanie kością
- Używanie innego typu kości
- Określanie źródła obserwacji przez klasteryzację
- Klasteryzacja w zastosowaniach biznesowych
- Analizowanie wielu wymiarów
- Klasteryzacja E-M
- Etap zgadywania
- Etap oczekiwań
- Etap maksymalizacji
- Etap konwergencji
- Inne metody klasteryzacji
- Inne metody uczenia nienadzorowanego
- Podsumowanie
8. Web scraping
- Jak działają witryny internetowe?
- Twój pierwszy scraper
- Parsowanie kodu HTML
- Scraping adresów e-mail
- Bezpośrednie wyszukiwanie adresów
- Wyrażenia regularne
- Używanie metaznaków do elastycznych wyszukiwań
- Dostrajanie wyszukiwań z wykorzystaniem sekwencji unikowych
- Łączenie metaznaków w wyszukiwaniach zaawansowanych
- Używanie wyrażeń regularnych do wyszukiwania adresów e-mail
- Przekształcanie wyników w użyteczne dane
- Używanie biblioteki Beautiful Soup
- Parsowanie elementów etykiety HTML
- Scraping i parsowanie tabel HTML
- Zaawansowany scraping
- Podsumowanie
9. Systemy rekomendacyjne
- Rekomendacje oparte na popularności
- Filtrowanie kolaboratywne oparte na artykułach
- Mierzenie podobieństwa wektorów
- Obliczanie podobieństwa kosinusowego
- Implementowanie filtrowania kolaboratywnego opartego na artykułach
- Filtrowanie kolaboratywne oparte na użytkownikach
- Studium przypadku: rekomendacje muzyczne
- Generowanie rekomendacji za pomocą zaawansowanych systemów
- Podsumowanie
10. Przetwarzanie języka naturalnego
- Używanie NLP do wykrywania plagiatów
- Model NLP word2vec
- Ocenianie podobieństw między słowami
- Tworzenie układu równań
- Analizowanie wektorów liczbowych w word2vec
- Manipulowanie wektorami poprzez obliczenia matematyczne
- Wykrywanie plagiatów z wykorzystaniem word2vec
- Model skip-thoughts
- Modelowanie tematyczne
- Inne zastosowania NLP
- Podsumowanie
11. Data science w innych językach
- Wygrywanie meczów piłkarskich z pomocą SQL-a
- Wczytywanie i analizowanie danych
- Podstawy SQL-a
- Tworzenie bazy danych SQL
- Wykonywanie kwerend SQL
- Łączenie danych poprzez łączenie tabel
- Wygrywanie meczów piłkarskich z pomocą języka R
- Podstawy języka R
- Stosowanie regresji liniowej w języku R
- Kreślenie danych w R
- Inne przydatne umiejętności
- Podsumowanie
Skorowidz