reklama - zainteresowany?

Data Mining. Eksploracja danych w sieciach społecznościowych. Wydanie III - Helion


ebook
Autor: Matthew A. Russell, Mikhail Klassen
Tytuł oryginału: Mining the Social Web: Data Mining Facebook, Twitter, LinkedIn, Google+, GitHub, and More, 3rd Edition
Tłumaczenie: Radosław Meryk
ISBN: 978-83-283-5555-2
stron: 401, Format: ebook
Księgarnia: Helion

Cena książki: 69,00 zł

Książka będzie dostępna od sierpnia 2019

Tagi: Python - Programowanie | Social Media

Internetu nie można rozważać wyłącznie jako tworu techniki. Powstanie tej sieci doprowadziło do rozwoju różnych zjawisk społecznych. Z tej perspektywy na szczególną uwagę zasługują media społecznościowe. Są źródłem informacji, które, właściwie spożytkowane, mogą przynieść niezły dochód. Mogą też dać odpowiedzi na wiele pytań zadawanych przez naukowców z różnych branż. Sama eksploracja tych danych przynosi sporo satysfakcji i radości. Zaskakujące przy tym jest to, że przygotowanie zestawu potrzebnych narzędzi i nauka posługiwania się nimi zabiera naprawdę niewiele czasu i nie wymaga specjalnych talentów!

To trzecie, zaktualizowane wydanie popularnego podręcznika dla osób, które chcą zająć się wydobywaniem danych z sieci społecznościowych. Uwzględniono tu zmiany interfejsów API wprowadzone do poszczególnych platform i dodano rozdział o eksploracji Instagrama. Dowiesz się, jak dzięki danym z mediów społecznościowych określić sieć powiązań użytkowników, zorientować się, kto o czym mówi i gdzie się znajduje. Treść bogato zilustrowano przykładami kodu w Pythonie, a także plikami Jupyter Notebook lub kontenerów Dockera. Ciekawym elementem książki jest zbiór receptur dotyczących rozwiązywania konkretnych problemów z Twitterem.

W tej książce między innymi:

  • wprowadzenie do świata mediów społecznościowych
  • przybliżenie bogactwa danych zawartych w mediach społecznościowych
  • eksploracja danych za pomocą narzędzi Pythona 3
  • zaawansowane techniki eksploracji danych, w tym współczynniki TFIDF, podobieństwo kosinusów i rozpoznawanie obrazów
  • tworzenie wizualizacji pozyskanych danych

Jakie informacje dziś znajdziesz dzięki danym z Facebooka?

Spis treści

Data Mining. Eksploracja danych w sieciach społecznościowych. Wydanie III eBook -- spis treści

  • Przedmowa
    • Uwagi od Matthew Russella
    • Przeczytaj to najpierw
      • Wyjść naprzeciw oczekiwaniom
      • Technologia bazująca na Pythonie
      • Poprawki do trzeciego wydania
      • Etyka eksploracji danych
      • Konwencje stosowane w książce
    • Korzystanie z przykładów kodu
    • Podziękowania do trzeciego wydania
    • Podziękowania do drugiego wydania
    • Podziękowania do pierwszego wydania
  • Część I. Przewodnik po sieciach społecznościowych
  • Wstęp
  • Rozdział 1. Eksploracja Twittera: odkrywanie trendów, dowiadywanie się, o czym się rozmawia, i trochę więcej
    • 1.1. Przegląd
    • 1.2. Dlaczego Twitter to jest to?
    • 1.3. Odkrywanie API Twittera
      • 1.3.1. Podstawowa terminologia związana z Twitterem
      • 1.3.2. Tworzenie połączenia z API Twittera
      • 1.3.3. Odkrywanie trendów
      • 1.3.4. Wyszukiwanie tweetów
    • 1.4. Analiza 140 (lub więcej) znaków
      • 1.4.1. Wyodrębnianie podmiotów z tweetów
      • 1.4.2. Analizowanie tweetów i występujących w nich podmiotów z wykorzystaniem analizy częstości
      • 1.4.3. Obliczanie różnorodności leksykalnej tweetów
      • 1.4.4. Badanie wzorców w retweetach
      • 1.4.5. Wizualizacja danych częstości za pomocą histogramów
    • 1.5. Uwagi końcowe
    • 1.6. Zalecane ćwiczenia
    • 1.7. Zasoby online
  • Rozdział 2. Eksploracja Facebooka: analizowanie fanpagey, znajomości i więcej
    • 2.1. Przegląd
    • 2.2. Interfejs API Graph Facebooka
      • 2.2.1. Wprowadzenie do API Graph
      • 2.2.2. Protokół Open Graph
    • 2.3. Analiza połączeń grafu społecznościowego
      • 2.3.1. Analizowanie stron Facebooka
        • Analiza strony Facebooka tej książki
        • Angażowanie fanów i mierzenie siły marki mediów społecznościowych
      • 2.3.2. Manipulowanie danymi z wykorzystaniem pakietu pandas
        • Wizualizacja zaangażowania odbiorców z wykorzystaniem matplotlib
        • Obliczanie średniego zaangażowania
    • 2.4. Uwagi końcowe
    • 2.5. Zalecane ćwiczenia
    • 2.6. Zasoby online
  • Rozdział 3. Eksploracja Instagrama: komputerowy wzrok, sieci neuronowe, rozpoznawanie obiektów i wykrywanie twarzy
    • 3.1. Przegląd
    • 3.2. Poznawanie API Instagrama
      • 3.2.1. Tworzenie żądań do API Instagrama
      • 3.2.2. Odczytywanie własnego kanału na Instagramie
      • 3.2.3. Pobieranie medium według hashtagu
    • 3.3. Anatomia posta na Instagramie
    • 3.4. Szybki kurs na temat sztucznych sieci neuronowych
      • 3.4.1. Trening sieci neuronowej pod kątem oglądania zdjęć
      • 3.4.2. Rozpoznawanie cyfr pisanych odręcznie
      • 3.4.3. Rozpoznawanie obiektów na zdjęciach przy użyciu wstępnie przeszkolonych sieci neuronowych
    • 3.5. Wykorzystanie sieci neuronowych do postów na Instagramie
      • 3.5.1. Oznaczanie zawartości obrazu
      • 3.5.2. Wykrywanie twarzy na zdjęciach
    • 3.6. Uwagi końcowe
    • 3.7. Zalecane ćwiczenia
    • 3.8. Zasoby online
  • Rozdział 4.
  • Eksploracja sieci LinkedIn: stanowiska, współpracownicy i nie tylko
    • 4.1. Przegląd
    • 4.2. Poznawanie API LinkedIna
      • 4.2.1. Tworzenie żądań do API LinkedIn
      • 4.2.2. Pobieranie połączeń LinkedIn w pliku CSV
    • 4.3. Krótki kurs grupowania danych
      • 4.3.1. Normalizacja danych w celu umożliwienia analizy
        • Normalizacja i liczenie firm
        • Normalizacja i liczenie nazw stanowisk
        • Normalizacja i liczenie lokalizacji
        • Wizualizacja lokalizacji za pomocą kartogramów
      • 4.3.2. Mierzenie podobieństwa
      • 4.3.3. Algorytmy klasteryzacji
        • Klasteryzacja zachłanna
        • Analiza runtime
        • Klasteryzacja hierarchiczna
        • Klasteryzacja metodą k-średnich
        • Wizualizacja klastrów geograficznych z wykorzystaniem Google Earth
    • 4.4. Uwagi końcowe
    • 4.5. Zalecane ćwiczenia
    • 4.6. Zasoby online
  • Rozdział 5. Eksploracja danych z plików tekstowych: obliczanie podobieństwa dokumentów, wyodrębnianie kolokacji i inne
    • 5.1. Przegląd
    • 5.2. Pliki tekstowe
    • 5.3. Wprowadzenie do TF-IDF
      • 5.3.1. Częstość terminu
      • 5.3.2. Odwrotna częstość dokumentu
      • 5.3.3. TF-IDF
    • 5.4. Odpytywanie danych w języku naturalnym za pomocą TF-IDF
      • 5.4.1. Natural Language Toolkit wprowadzenie
      • 5.4.2. Zastosowanie współczynnika TF-IDF do języka naturalnego
      • 5.4.3. Wyszukiwanie podobnych dokumentów
        • Teoria modeli przestrzeni wektorowej i podobieństwa kosinusowego
        • Klasteryzacja postów z wykorzystaniem podobieństwa kosinusowego
        • Wizualizacja podobieństwa dokumentu z wykorzystaniem wykresu macierzowego
      • 5.4.4. Analiza bigramów w języku naturalnym
        • Tabele kontyngencji i funkcje oceny
      • 5.4.5. Refleksje na temat analizy danych języka naturalnego
    • 5.5. Uwagi końcowe
    • 5.6. Zalecane ćwiczenia
    • 5.7. Zasoby online
  • Rozdział 6. Eksploracja stron internetowych: przetwarzanie języka naturalnego w celu zrozumienia języka ludzkiego, tworzenie podsumowań postów na blogu i inne
    • 6.1. Przegląd
    • 6.2. Scraping, parsowanie i crawling stron internetowych
      • 6.2.1. Przeszukiwanie wszerz w crawlingu stron internetowych
    • 6.3. Odkrywanie semantyki przez dekodowanie składni
      • 6.3.1. Przetwarzanie języka naturalnego krok po kroku
      • 6.3.2. Wykrywanie zdań w danych w języku naturalnym
      • 6.3.3. Tworzenie streszczeń dokumentów
        • Analiza algorytmu tworzenia streszczeń Luhna
    • 6.4. Zmiana paradygmatu. Analiza obiektów
      • 6.4.1. Podsumowania danych w języku naturalnym
    • 6.5. Jakość analiz do przetwarzania danych w języku naturalnym
    • 6.6. Uwagi końcowe
    • 6.7. Zalecane ćwiczenia
    • 6.8. Zasoby online
  • Rozdział 7.
  • Eksploracja skrzynek pocztowych: analiza, kto rozmawia z kim, o czym, jak często i nie tylko
    • 7.1. Przegląd
    • 7.2. Uzyskiwanie i przetwarzanie korpusu danych pocztowych
      • 7.2.1. Uniksowe skrzynki pocztowe
      • 7.2.2. Pobieranie danych Enron
      • 7.2.3. Konwersja korpusu poczty na uniksowy format mbox
      • 7.2.4. Konwertowanie uniksowych skrzynek pocztowych na obiekty DataFrame biblioteki pandas
    • 7.3. Analiza korpusu Enron
      • 7.3.1. Zapytania według zakresu dat (godzin)
      • 7.3.2. Analiza wzorców w komunikacji nadawca-odbiorca
      • 7.3.3. Wyszukiwanie wiadomości e-mail według słów kluczowych
    • 7.4. Analiza własnych danych pocztowych
      • 7.4.1. Dostęp do Twojej skrzynki Gmail za pomocą OAuth
      • 7.4.2. Pobieranie i parsowanie wiadomości e-mail
      • 7.4.3. Wizualizacja wzorców w e-mailu za pomocą frameworka Immersion
    • 7.5. Uwagi końcowe
    • 7.6. Zalecane ćwiczenia
    • 7.7. Zasoby online
  • Rozdział 8.
  • Eksploracja serwisu GitHub: badanie nawyków podczas współtworzenia oprogramowania, tworzenie grafów zainteresowań i nie tylko
    • 8.1. Przegląd
    • 8.2. Odkrywanie API GitHuba
      • 8.2.1. Tworzenie połączenia do API serwisu GitHub
      • 8.2.2. Tworzenie żądań do API GitHuba
    • 8.3. Modelowanie danych za pomocą grafów właściwości
    • 8.4. Analiza grafów zainteresowań serwisu GitHub
      • 8.4.1. Wysiewanie grafu zainteresowań
      • 8.4.2. Obliczanie miar centralności grafu
      • 8.4.3. Rozszerzanie grafu zainteresowań z wykorzystaniem krawędzi śledzi dla użytkowników
        • Zastosowanie miar centralności
        • Dodanie kolejnych repozytoriów do grafu zainteresowań
        • Problemy obliczeniowe
      • 8.4.4. Używanie węzłów jako punktów przestawnych w celu tworzenia bardziej wydajnych zapytań
      • 8.4.5. Wizualizacja grafów zainteresowań
    • 8.5. Uwagi końcowe
    • 8.6. Zalecane ćwiczenia
    • 8.7. Zasoby online
  • Część II. Twitter. Receptury
  • Rozdział 9.
  • Twitter. Receptury
    • 9.1. Dostęp do interfejsu API Twittera dla celów programistycznych
      • 9.1.1. Problem
      • 9.1.2. Rozwiązanie
      • 9.1.3. Opis
    • 9.2. Wykorzystanie OAuth w celu uzyskania dostępu do interfejsu API Twittera dla aplikacji produkcyjnych
      • 9.2.1. Problem
      • 9.2.2. Rozwiązanie
      • 9.2.3. Opis
    • 9.3. Odkrywanie trendów
      • 9.3.1. Problem
      • 9.3.2. Rozwiązanie
      • 9.3.3. Opis
    • 9.4. Wyszukiwanie tweetów
      • 9.4.1. Problem
      • 9.4.2. Rozwiązanie
      • 9.4.3. Opis
    • 9.5. Konstruowanie wygodnych wywołań funkcji
      • 9.5.1. Problem
      • 9.5.2. Rozwiązanie
      • 9.5.3. Opis
    • 9.6 Zapisywanie i przywracanie danych JSON z wykorzystaniem plików tekstowych
      • 9.6.1. Problem
      • 9.6.2. Rozwiązanie
      • 9.6.3. Opis
    • 9.7. Zapisywanie danych JSON i uzyskiwanie dostępu do nich za pomocą MongoDB
      • 9.7.1. Problem
      • 9.7.2. Rozwiązanie
      • 9.7.3. Opis
    • 9.8. Pobieranie próbek z mechanizmu firehose Twittera za pomocą API Streaming
      • 9.8.1. Problem
      • 9.8.2. Rozwiązanie
      • 9.8.3. Opis
    • 9.9. Pobieranie danych szeregów czasowych
      • 9.9.1. Problem
      • 9.9.2. Rozwiązanie
      • 9.9.3. Opis
    • 9.10. Wyodrębnianie podmiotów z tweetów
      • 9.10.1. Problem
      • 9.10.2. Rozwiązanie
      • 9.10.3. Opis
    • 9.11. Znajdowanie najpopularniejszych tweetów w kolekcji
      • 9.11.1. Problem
      • 9.11.2. Rozwiązanie
      • 9.11.3. Opis
    • 9.12. Znajdowanie najpopularniejszych obiektów w kolekcji tweetów
      • 9.12.1. Problem
      • 9.12.2. Rozwiązanie
      • 9.12.3. Opis
    • 9.13. Tabularyzacja analizy częstości
      • 9.13.1. Problem
      • 9.13.2. Rozwiązanie
      • 9.13.3. Opis
    • 9.14. Znajdowanie użytkowników, którzy retweetowali status
      • 9.14.1. Problem
      • 9.14.2. Rozwiązanie
      • 9.14.3. Opis
    • 9.15. Wyodrębnianie przypisania retweeta
      • 9.15.1. Problem
      • 9.15.2. Rozwiązanie
      • 9.15.3. Opis
    • 9.16. Wykonywanie odpornych na błędy żądań do Twittera
      • 9.16.1. Problem
      • 9.16.2. Rozwiązanie
      • 9.16.3. Opis
    • 9.17. Pobieranie informacji o profilu użytkownika
      • 9.17.1. Problem
      • 9.17.2. Rozwiązanie
      • 9.17.3. Opis
    • 9.18. Wyodrębnianie podmiotów tweeta z dowolnego tekstu
      • 9.18.1. Problem
      • 9.18.2. Rozwiązanie
      • 9.18.3. Opis
    • 9.19. Pobieranie wszystkich znajomych lub obserwatorów użytkownika
      • 9.19.1. Problem
      • 9.19.2. Rozwiązanie
      • 9.19.3. Opis
    • 9.20. Analiza znajomych i obserwatorów użytkownika
      • 9.20.1. Problem
      • 9.20.2. Rozwiązanie
      • 9.20.3. Opis
    • 9.21. Zbieranie tweetów użytkownika
      • 9.21.1. Problem
      • 9.21.2. Rozwiązanie
      • 9.21.3. Opis
    • 9.22. Crawling grafu znajomości
      • 9.22.1. Problem
      • 9.22.2. Rozwiązanie
      • 9.22.3. Opis
    • 9.23. Analiza treści tweetów
      • 9.23.1. Problem
      • 9.23.2. Rozwiązanie
      • 9.23.3. Opis
    • 9.24. Tworzenie streszczeń celów łączy
      • 9.24.1. Problem
      • 9.24.2. Rozwiązanie
      • 9.24.3. Opis
    • 9.25. Analizowanie ulubionych tweetów użytkownika
      • 9.25.1. Problem
      • 9.25.2. Rozwiązanie
      • 9.25.3. Opis
    • 9.26. Uwagi końcowe
    • 9.27. Zalecane ćwiczenia
    • 9.28. Zasoby online
  • Część III. Załączniki
  • Dodatek A. Informacje o maszynie wirtualnej przeznaczonej dla tej książki
  • Dodatek B. Elementarz OAuth
    • Przegląd
      • OAuth 1.0a
      • OAuth 2.0
  • Dodatek C. Porady i wskazówki na temat Pythona i środowiska Jupyter Notebook
    • O autorach
    • Kolofon

Code, Publish & WebDesing by CATALIST.com.pl



(c) 2005-2019 CATALIST agencja interaktywna, znaki firmowe należą do wydawnictwa Helion S.A.