Microsoft SQL Server. Modelowanie i eksploracja danych - Helion

Autor: Danuta Mendrala, Marcin Szeliga
ISBN: 978-83-246-3440-8
stron: 424, Format: 158x235, okładka: miękka
Data wydania: 2012-03-12
Księgarnia: Helion

Cena książki: 69,00 zł

Pobierz fragment książki » Osoby, które kupiły tę książkę, wybierały także »

Tagi: Analiza danych | Big Data | SQL Server

Odkryj najlepsze narzędzia do eksploracji danych
Naucz się przygotowywać dane i poprawiać ich jakość
Dowiedz się, jak prowadzić zaawansowane analizy danych

Poznaj sprawdzone techniki profesjonalnej eksploracji danych!

Eksploracja danych jest najmłodszą i najszybciej rozwijającą się dziedziną informatyki. Łączy zaawansowane algorytmy analizowania danych i znajdowania ukrytych w nich wzorców z klasycznymi technikami statystycznymi, rachunkiem prawdopodobieństwa i technologiami bazodanowymi. Dziedzina ta zyskuje na znaczeniu wraz z lawinowo rosnącą ilością informacji cyfrowych, które każdego dnia na całym świecie są wytwarzane, zapisywane i przeszukiwane przez stale zwiększającą się grupę użytkowników technologii informatycznych. Trzydzieści lat temu świat zrewolucjonizowały komputery PC, a dziś w ogarnięciu tego chaosu pomóc mogą jedynie najskuteczniejsze narzędzia do modelowania i eksploracji danych.

"Microsoft SQL Server. Modelowanie i eksploracja danych" to książka, z której analitycy, informatycy i biznesmeni dowiedzą się, jak tworzyć właściwe modele, odpowiednio przygotowywać dane i prawidłowo je eksplorować, a także jak należycie analizować i oceniać otrzymane wyniki przy użyciu narzędzi oferowanych przez oprogramowanie Microsoft SQL Server. Publikacja przybliża zagadnienia związane z poszczególnymi etapami procesu modelowania i eksploracji, prezentując przy tym zastosowanie różnych metod i technik analizy do rozwiązywania praktycznych problemów naukowych i biznesowych.

Podstawowe techniki i narzędzia wykorzystywane w eksploracji danych
Instalacja i konfiguracja niezbędnego oprogramowania
Analiza biznesowa projektu eksploracji danych
Ocena, przygotowywanie i poprawianie jakości danych
Przegląd technik eksploracji danych
Wykorzystywanie serwera SQL w procesie eksploracji danych
Składnia i zastosowanie języka DMX
Łatwe w użyciu narzędzia pakietu Office i zaawansowane narzędzia eksploracji danych serwera SQL firmy Microsoft
Zasada działania zaawansowanych algorytmów eksploracji danych
Ocena i poprawianie modeli eksploracyjnych
Programowanie predykcyjne

Naucz się wykorzystywać zaawansowane narzędzia do inteligentnej zamiany dużych zbiorów danych w przydatne informacje!

Osoby które kupowały "Microsoft SQL Server. Modelowanie i eksploracja danych", wybierały także:

Data Science w Pythonie. Kurs video. Przetwarzanie i analiza danych 149,00 zł, (67,05 zł -55%)
Excel 2013. Kurs video. Poziom drugi. Przetwarzanie i analiza danych 79,00 zł, (35,55 zł -55%)
Kompletny przewodnik po Power Query (M). Opanuj wykonywanie z 169,00 zł, (84,50 zł -50%)
OSINT w praktyce. Jak gromadzi 67,00 zł, (33,50 zł -50%)
Mistrz analizy danych. Od danych do wiedzy. Wydanie II 99,00 zł, (49,50 zł -50%)

Spis treści

Microsoft SQL Server. Modelowanie i eksploracja danych -- spis treści

Wstęp (9)

Proces eksploracji danych (10)
Instalacja i konfiguracja narzędzi (12)
- Serwer SQL (12)
- Arkusz kalkulacyjny Excel (15)
- Dodatek Data Mining do pakietu Office (15)
- Przykłady (16)
Konwencje i oznaczenia (20)

Część I: Modelowanie (23)

Rozdział 1. Eksploracja danych jako technika wspomagania decyzji (25)

Modelowanie świata (25)
- Obiekty, zdarzenia i reguły (26)
- Dane (27)
- Informacje (27)
- Wiedza (29)
- Decyzje (31)
Eksploracja danych (32)
- Hipotezy (32)
- Kłopoty ze sformułowaniem problemu (33)

Rozdział 2. Analiza biznesowa (35)

Cele modelowania i eksploracji danych (35)
- Opisywanie danych czy wspieranie decyzji? (36)
- Decydenci (38)
Zakres projektu eksploracji danych (39)
- Dane źródłowe (40)
- Kontekst (40)
Sprecyzowanie spodziewanych wyników (42)
- Modele deskrypcyjne (43)
- Modele predykcyjne (43)
Prawdopodobieństwo sukcesu projektu eksploracji danych (44)
Ocena ryzyka (45)

Rozdział 3. Ocena danych (49)

Dane źródłowe (49)
- Błędy pomiaru (50)
Przypadki, czyli to, co badamy (51)
Profilowanie danych za pomocą usługi SQL Server Integration Services (54)
Atrybuty i ich stany (57)
- Atrybuty jednowartościowe i wielowartościowe (57)
- Atrybuty monotoniczne (59)
- Rozkład wartości (59)
Integralność danych (62)
- Duplikaty (62)
- Zakres wartości (63)
- Zgodność ze wzorcem (63)
Próbkowanie i reprezentatywność danych (64)
- Próbkowanie danych (64)
- Zbieżność do rzeczywistego rozkładu (65)
- Odchylenie standardowe (67)
- Zmienność atrybutów tekstowych (68)
Brakujące dane (69)
- Model brakujących danych (70)
Zależności pomiędzy atrybutami (73)
- Niezależne atrybuty (74)
- Nadmiarowe atrybuty (75)
- Anachronizmy (76)
Mierzenie informacji (76)
- Bity (77)
- Zaskoczenie (77)
- Kontekst (78)

Rozdział 4. Przygotowanie danych (79)

Przestrzeń stanów (79)
Atrybuty dyskretne (81)
- Grupowanie (81)
- Numerowanie stanów (84)
- Atrybuty porządkowe (85)
- Atrybuty okresowe (86)
Atrybuty ciągłe (86)
- Wartości skrajne (87)
- Normalizacja zakresu (87)
- Dyskretyzacja (90)
Serie danych (92)
- Trend (96)
- Okresowość i sezonowość (96)
- Szum (97)

Rozdział 5. Poprawa jakości danych (99)

Uzupełnienie wartości (99)
Wzbogacenie danych (103)
Redukcja wymiarów (105)
- Korelacje (106)
Dane dla modeli deskrypcyjnych (108)
Dane dla modeli predykcyjnych (109)
- Zmiana proporcji (109)
Dane na potrzeby analizy wariantowej (111)
- Analiza wariantowa (111)
Wydzielenie danych testowych (113)

Część II: Eksploracja (117)

Rozdział 6. Techniki eksploracji danych (119)

Zastosowania (119)
Dodatek Data Mining do pakietu Office (121)
- Ocena i przygotowanie danych źródłowych (121)
Techniki eksploracji danych (126)
- Klasyfikacja (126)
- Szacowanie (136)
- Asocjacja (141)
- Grupowanie (145)
- Analiza sekwencyjna (151)
- Analiza wariantowa (152)
- Prognozowanie (156)

Rozdział 7. Serwer SQL jako platforma eksploracji danych (161)

Excel jako klient SQL Server Analysis Services (162)
- Narzędzia eksploracji zewnętrznych danych (162)
- Praca z modelami eksploracji danych (184)
- Formuły arkusza Excel (191)
Projekty eksploracji danych (192)
- Business Intelligence Development Studio (192)
- Źródła danych (195)
- Widoki danych źródłowych (196)
- Struktury eksploracji danych (199)
- Modele eksploracji danych (206)
- Zapytania predykcyjne (210)
- Zagnieżdżanie przypadków (213)
Zarządzanie serwerem SSAS i modelami eksploracji danych poprzez SQL Server Management Studio (216)
Usługi eksploracji danych serwera SQL (218)
- Architektura (219)
- Bezpieczeństwo (221)
- Integracja z pozostałymi usługami Business Intelligence (223)

Rozdział 8. DMX (227)

Terminologia (227)
- Atrybut (227)
- Wartość i stan (229)
- Przypadek (229)
- Klucze (230)
- Struktury eksploracji danych (231)
- Modele eksploracji danych (232)
Składnia języka DMX (232)
- Tworzenie struktur eksploracji danych (233)
- Tworzenie modeli eksploracji danych (235)
- Przetwarzanie struktur i modeli eksploracji danych (239)
- Odczytywanie zawartości struktur i modeli eksploracji danych (243)
- Zapytania predykcyjne (245)
- Funkcje predykcyjne (251)

Rozdział 9. Naiwny klasyfikator Bayesa firmy Microsoft (253)

Omówienie (253)
- Ograniczenia (255)
- Parametry (256)
Zastosowania naiwnego klasyfikatora Bayesa (258)
- Badanie zależności pomiędzy atrybutami (258)
- Klasyfikacja dokumentów (260)

Rozdział 10. Drzewa decyzyjne firmy Microsoft i algorytm regresji liniowej firmy Microsoft (267)

Omówienie (268)
- Ograniczenia (272)
- Parametry (273)
Zastosowania drzew decyzyjnych (275)
- Klasyfikacja klientów (275)
- Szacowanie potencjalnych zysków (277)
- Asocjacja klientów i wypożyczanych przez nich filmów (279)

Rozdział 11. Szeregi czasowe firmy Microsoft (281)

Omówienie (281)
- Ograniczenia (285)
- Parametry (286)
Zastosowania szeregów czasowych firmy Microsoft (288)
- Prognozowanie sprzedaży (289)
- Prognozowanie sprzedaży na podstawie przeplatanych serii danych (291)
- Prognozowanie sprzedaży na podstawie danych odczytanych z kostki wielowymiarowej (292)
- Prognozowanie sprzedaży na podstawie krótkich serii danych (293)
- Analiza wariantowa (295)

Rozdział 12. Algorytm klastrowania firmy Microsoft (297)

Omówienie (297)
- Ograniczenia (302)
- Parametry (303)
Zastosowania algorytmu klastrowania (305)
- Analiza skupień komórek (305)
- Klasyfikacja komórek (309)
- Przygotowanie danych do dalszej eksploracji (312)
- Wykrywanie anomalii (314)

Rozdział 13. Algorytm klastrowania sekwencyjnego firmy Microsoft (319)

Omówienie (320)
- Ograniczenia (323)
- Parametry (323)
Zastosowania algorytmu klastrowania sekwencyjnego (324)
- Analiza sekwencji odwiedzanych stron WWW (324)
- Klasyfikacja klientów na podstawie kolejności kupowanych przez nich towarów (327)
- Przewidywanie kolejnych zdarzeń (329)
- Wykrywanie nietypowych sekwencji zdarzeń (332)

Rozdział 14. Algorytm odkrywania reguł asocjacyjnych firmy Microsoft (335)

Omówienie (336)
- Ograniczenia (340)
- Parametry (341)
Zastosowania reguł asocjacyjnych (341)
- Badanie zależności pomiędzy wartościami atrybutów (342)
- Analiza koszykowa (343)
- Analiza typu cross-selling (347)

Rozdział 15. Sieci neuronowe firmy Microsoft i algorytm regresji logistycznej firmy Microsoft (351)

Omówienie (352)
- Ograniczenia (358)
- Parametry (360)
Zastosowania sieci neuronowych i regresji logistycznej (361)
- Szacowanie potencjalnych zysków (362)
- Klasyfikacja dokumentów (366)

Rozdział 16. Ocena i poprawa modeli (369)

Powrót do średniej (369)
Kryteria porównawcze (371)
- Łatwość interpretacji (373)
- Dokładność predykcji (374)
- Wiarygodność predykcji (374)
- Wydajność i skalowalność (375)
- Przydatność (375)
Metody oceniania modeli eksploracji danych (376)
- Wykresy podniesienia i zysku (376)
- Macierz klasyfikacji (384)
- Ocena dokładności modeli algorytmu szeregów czasowych firmy Microsoft (386)
- Walidacja krzyżowa (387)
- Odchylenie wewnątrz- i międzyklastrowe (390)
Problemy (391)
- Niewłaściwie postawione zadania (391)
- Niewłaściwe dane źródłowe (392)
- Nieprzygotowane dane źródłowe (393)
- Niewłaściwe lub źle sparametryzowane algorytmy eksploracji danych (394)

Rozdział 17. Programowanie predykcyjne (397)

Narzędzia programistyczne (397)
Wizualizatory modeli eksploracji danych (398)
Raporty usługi SSRS (399)
Inteligentne aplikacje (401)
- Kontrola poprawności danych (401)
- Uzupełnianie brakujących danych (404)
- Adaptacyjny interfejs (406)

Skorowidz (415)