Data science i Python. Stawianie czo - Helion

ebook

Autor: Bradford Tuckfield
Tytuł oryginału: Dive Into Data Science: Use Python To Tackle Your Toughest Business Challenges
Tłumaczenie: Grzegorz Werner
ISBN: 978-83-289-1015-7
stron: 280, Format: ebook
Data wydania: 2024-06-25
Księgarnia: Helion

Cena książki: 34,50 zł (poprzednio: 69,00 zł)
Oszczędzasz: 50% (-34,50 zł)

Pobierz fragment książki » Osoby, które kupiły tę książkę, wybierały także »

Tagi: Inne - Programowanie | Python - Programowanie

Data science to nieocenione wsparcie w rozwoju biznesu i dzia

Osoby które kupowały "Data science i Python. Stawianie czo", wybierały także:

Superinteligencja. Scenariusze, strategie, zagro 66,19 zł, (13,90 zł -79%)
Poradnik design thinking - czyli jak wykorzysta 49,64 zł, (13,90 zł -72%)
Architektura ewolucyjna. Projektowanie oprogramowania i wsparcie zmian 57,74 zł, (17,90 zł -69%)
F# 4.0 dla zaawansowanych. Wydanie IV 96,45 zł, (29,90 zł -69%)
Systemy reaktywne. Wzorce projektowe i ich stosowanie 65,31 zł, (20,90 zł -68%)

Spis treści

Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym eBook -- spis treści

Podziękowania

Wprowadzenie

1. Eksploracyjna analiza danych

Twój pierwszy dzień na stanowisku prezesa
- Znajdowanie wzorców w zbiorach danych
- Używanie plików .csv do przeglądania i przechowywania danych
Wyświetlanie danych w Pythonie
Obliczanie statystyk zbiorczych
Analizowanie podzbiorów danych
- Dane nocne
- Dane sezonowe
Wizualizacja danych za pomocą Matplotlib
- Rysowanie i wyświetlanie prostego wykresu
- Tytuły i etykiety na wykresach
- Kreślenie podzbiorów danych
- Testowanie różnych typów wykresów
Eksplorowanie korelacji
- Obliczanie korelacji
- Silna i słaba korelacja
- Znajdowanie korelacji między zmiennymi
Tworzenie map cieplnych
Dalsza eksploracja
Podsumowanie

2. Prognozowanie

Przewidywanie popytu
Oczyszczanie błędnych danych
Kreślenie danych w celu odkrywania trendów
Przeprowadzanie regresji liniowej
- Algebraiczne podstawy linii regresji
- Obliczanie miar błędu
Używanie regresji do prognozowania przyszłych trendów
Wypróbowywanie innych modeli regresji
- Przewidywanie sprzedaży z wykorzystaniem multiwariantnej regresji liniowej
- Oddawanie zmienności z wykorzystaniem trygonometrii
Wybieranie najlepszej regresji na potrzeby prognozowania
Dalsza eksploracja
Podsumowanie

3. Porównywanie grup

Dane dotyczące populacji
- Statystyki zbiorcze
- Próby losowe
- Różnice między próbami
Testowanie hipotez
- Test t
- Niuanse testowania hipotez
Porównywanie grup w kontekście praktycznym
Podsumowanie

4. Testy A/B

Potrzeba eksperymentowania
Przeprowadzanie eksperymentów w celu testowania nowych hipotez
- Matematyka testów A/B
- Przekładanie matematyki na praktykę
Optymalizacja z wykorzystaniem modelu mistrz - pretendent
Zapobieganie pomyłkom z wykorzystaniem prawa Twymana i testów A/A
Wielkości efektu
Obliczanie istotności danych
Zastosowania i kwestie zaawansowane
Etyka testów A/B
Podsumowanie

5. Klasyfikacja binarna

Minimalizowanie odpływu klientów
Używanie liniowych modeli prawdopodobieństwa do znajdowania klientów wysokiego ryzyka
- Wykres ryzyka odpływu
- Potwierdzanie zależności za pomocą regresji liniowej
- Przewidywanie przyszłości
- Dokonywanie rekomendacji biznesowych
- Mierzenie dokładności prognoz
- Multiwariantne modele LPM
- Tworzenie nowych miar
- Wady modeli LPM
Przewidywanie binarnych wyników za pomocą regresji logistycznej
- Rysowanie krzywych logistycznych
- Dopasowywanie krzywej logistycznej do danych
Zastosowania klasyfikacji binarnej
Podsumowanie

6. Uczenie nadzorowane

Przewidywanie ruchu w witrynie internetowej
Wczytywanie i wykreślanie danych dotyczących artykułów
Używanie regresji liniowej jako metody przewidywania
Uczenie nadzorowane
Metoda k najbliższych sąsiadów
- Implementowanie metody k-NN
- Analiza k-NN z wykorzystaniem pakietu sklearn
Używanie innych algorytmów uczenia nadzorowanego
- Drzewa decyzyjne
- Lasy losowe
- Sieci neuronowe
Mierzenie dokładności prognoz
Praca z modelami multiwariantnymi
Używanie klasyfikacji zamiast regresji
Podsumowanie

7. Uczenie nienadzorowane

Uczenie nadzorowane a uczenie nienadzorowane
Generowanie i eksplorowanie danych
- Rzucanie kością
- Używanie innego typu kości
Określanie źródła obserwacji przez klasteryzację
Klasteryzacja w zastosowaniach biznesowych
Analizowanie wielu wymiarów
Klasteryzacja E-M
- Etap zgadywania
- Etap oczekiwań
- Etap maksymalizacji
- Etap konwergencji
Inne metody klasteryzacji
Inne metody uczenia nienadzorowanego
Podsumowanie

8. Web scraping

Jak działają witryny internetowe?
Twój pierwszy scraper
Parsowanie kodu HTML
- Scraping adresów e-mail
- Bezpośrednie wyszukiwanie adresów
Wyrażenia regularne
- Używanie metaznaków do elastycznych wyszukiwań
- Dostrajanie wyszukiwań z wykorzystaniem sekwencji unikowych
- Łączenie metaznaków w wyszukiwaniach zaawansowanych
Używanie wyrażeń regularnych do wyszukiwania adresów e-mail
Przekształcanie wyników w użyteczne dane
Używanie biblioteki Beautiful Soup
- Parsowanie elementów etykiety HTML
- Scraping i parsowanie tabel HTML
Zaawansowany scraping
Podsumowanie

9. Systemy rekomendacyjne

Rekomendacje oparte na popularności
Filtrowanie kolaboratywne oparte na artykułach
- Mierzenie podobieństwa wektorów
- Obliczanie podobieństwa kosinusowego
- Implementowanie filtrowania kolaboratywnego opartego na artykułach
Filtrowanie kolaboratywne oparte na użytkownikach
Studium przypadku: rekomendacje muzyczne
Generowanie rekomendacji za pomocą zaawansowanych systemów
Podsumowanie

10. Przetwarzanie języka naturalnego

Używanie NLP do wykrywania plagiatów
Model NLP word2vec
- Ocenianie podobieństw między słowami
- Tworzenie układu równań
Analizowanie wektorów liczbowych w word2vec
- Manipulowanie wektorami poprzez obliczenia matematyczne
- Wykrywanie plagiatów z wykorzystaniem word2vec
Model skip-thoughts
Modelowanie tematyczne
Inne zastosowania NLP
Podsumowanie

11. Data science w innych językach

Wygrywanie meczów piłkarskich z pomocą SQL-a
- Wczytywanie i analizowanie danych
- Podstawy SQL-a
- Tworzenie bazy danych SQL
- Wykonywanie kwerend SQL
- Łączenie danych poprzez łączenie tabel
Wygrywanie meczów piłkarskich z pomocą języka R
- Podstawy języka R
- Stosowanie regresji liniowej w języku R
- Kreślenie danych w R
Inne przydatne umiejętności
Podsumowanie

Skorowidz