TPD-grupowanie2011.pdf
(
3446 KB
)
Pobierz
Analiza Skupień - Grupowanie
Zaawansowana Eksploracja Danych
JERZY STEFANOWSKI
Inst. Informatyki PP
Wersja dla TPD 2009
Poprawiona 2012
Organizacja wykładu
• Wprowadzenie i możliwe zastosowania
• Podstawy (odległości, …) .
• Dobór parametrów algorytmów:
• Hierarchiczne (AHC)
• k -
średnich
• Studium przypadku użycia
• Rozszerzenia dla analizy danych o większych
rozmiarach.
• Podsumowanie
Elementy terminologiczne
Trochę uwag:
• Cluster Analysis
→
Analiza skupień, grupowanie.
• Numerical taxonomy
→
Metody taksonomiczne
(ekonomia)
• Uwaga: znaczenie taksonomii w biologii może mieć inny
kontest (podział systematyczny oparty o taksony)
• Cluster→ Skupienie, skupisko, grupa / klasa / pojęcie
• Nigdy nie mów:
klaster, klastering, klastrowanie!
…
Polski elementy w rozwoju analizy skupień
•
Jan Czekanowski
(1882-1965) - wybitny polski
antropolog, etnograf, demograf i statystyk, profesor
Uniwersytetu Lwowskiego (1913 – 1941) oraz
Uniwersytetu Poznańskiego (1946 – 1960).
• Nowe odległości i metody przetwarzania macierzy odległości w
algorytmach, …, tzw. metoda Czekanowskiego.
• Kontynuacja Jerzy Fierich (1900-1965) Kraków
•
Hugo Steinhaus,
(matematycy Lwów i Wrocław)
• Wrocławska szkoła taksonomiczna (metoda dendrytowa)
•
Zdzisław Hellwig
(Wrocław)
• wielowymiarowa analizą porównawcza, i inne …
•
•
Współcześnie …
„ Sekcja Klasyfikacji i Analizy Danych” (SKAD) Polskiego Towarzystwa
Statystycznego
Referencje do literatury (przykładowe)
• Koronacki J. Statystyczne systemy uczące się, WNT
2005.
• Pociecha J., Podolec B., Sokołowski A., Zając K. „Metody
taksonomiczne w badaniach społeczno-ekonomicznych”.
PWN, Warszawa 1988,
• Stąpor K. „Automatyczna klasyfikacja obiektów”
Akademicka Oficyna Wydawnicza EXIT, Warszawa 2005.
• Hand, Mannila, Smyth, „Eksploracja danych”, WNT 2005.
• Larose D: „Odkrywania wiedzy z danych”, PWN 2006.
• Kucharczyk J. „Algorytmy analizy skupień w języku
ALGOL 60” PWN Warszawa, 1982,
• Materiały szkoleniowe firmy Statsoft.
Plik z chomika:
Lexor2
Inne pliki z tego folderu:
cwicz-inddrzew.pdf
(128 KB)
DMpreprocessingdodatkowe.pdf
(2240 KB)
DMwstep.pdf
(699 KB)
DMmultipleclassifiers.pdf
(1715 KB)
CASESTUDY12.pdf
(183 KB)
Inne foldery tego chomika:
Bazy danych 1 (BD1)
HDA - Hurtownie Danych
Zgłoś jeśli
naruszono regulamin