TPD-grupowanie2011.pdf

(3446 KB) Pobierz
Analiza Skupień - Grupowanie
Zaawansowana Eksploracja Danych
JERZY STEFANOWSKI
Inst. Informatyki PP
Wersja dla TPD 2009
Poprawiona 2012
Organizacja wykładu
• Wprowadzenie i możliwe zastosowania
• Podstawy (odległości, …) .
• Dobór parametrów algorytmów:
• Hierarchiczne (AHC)
• k -
średnich
• Studium przypadku użycia
• Rozszerzenia dla analizy danych o większych
rozmiarach.
• Podsumowanie
Elementy terminologiczne
Trochę uwag:
• Cluster Analysis
Analiza skupień, grupowanie.
• Numerical taxonomy
Metody taksonomiczne
(ekonomia)
• Uwaga: znaczenie taksonomii w biologii może mieć inny
kontest (podział systematyczny oparty o taksony)
• Cluster→ Skupienie, skupisko, grupa / klasa / pojęcie
• Nigdy nie mów:
klaster, klastering, klastrowanie!
Polski elementy w rozwoju analizy skupień
Jan Czekanowski
(1882-1965) - wybitny polski
antropolog, etnograf, demograf i statystyk, profesor
Uniwersytetu Lwowskiego (1913 – 1941) oraz
Uniwersytetu Poznańskiego (1946 – 1960).
• Nowe odległości i metody przetwarzania macierzy odległości w
algorytmach, …, tzw. metoda Czekanowskiego.
• Kontynuacja Jerzy Fierich (1900-1965) Kraków
Hugo Steinhaus,
(matematycy Lwów i Wrocław)
• Wrocławska szkoła taksonomiczna (metoda dendrytowa)
Zdzisław Hellwig
(Wrocław)
• wielowymiarowa analizą porównawcza, i inne …
Współcześnie …
„ Sekcja Klasyfikacji i Analizy Danych” (SKAD) Polskiego Towarzystwa
Statystycznego
Referencje do literatury (przykładowe)
• Koronacki J. Statystyczne systemy uczące się, WNT
2005.
• Pociecha J., Podolec B., Sokołowski A., Zając K. „Metody
taksonomiczne w badaniach społeczno-ekonomicznych”.
PWN, Warszawa 1988,
• Stąpor K. „Automatyczna klasyfikacja obiektów”
Akademicka Oficyna Wydawnicza EXIT, Warszawa 2005.
• Hand, Mannila, Smyth, „Eksploracja danych”, WNT 2005.
• Larose D: „Odkrywania wiedzy z danych”, PWN 2006.
• Kucharczyk J. „Algorytmy analizy skupień w języku
ALGOL 60” PWN Warszawa, 1982,
• Materiały szkoleniowe firmy Statsoft.
Zgłoś jeśli naruszono regulamin