Analiza danych eksperymentalnych
Informacje ogólne
Kod przedmiotu: | WELDECSI-ADE |
Kod Erasmus / ISCED: | (brak danych) / (brak danych) |
Nazwa przedmiotu: | Analiza danych eksperymentalnych |
Jednostka: | Wydział Elektroniki |
Grupy: | |
Punkty ECTS i inne: |
(brak)
|
Język prowadzenia: | polski |
Forma studiów: | stacjonarne |
Rodzaj studiów: | I stopnia |
Rodzaj przedmiotu: | obowiązkowy |
Forma zajęć liczba godzin/rygor: | W 20/+, Ć 25/+ |
Przedmioty wprowadzające: | Analiza matematyczna / rachunek macierzowy, rachunek prawdopo-dobieństwa. Metodyka i techniki programowania / podstawy pracy w środowisku Matlab. |
Programy: | Energetyka / energoelektronika |
Autor: | dr inż. Jacek Jakubowski |
Skrócony opis: |
Przedmiot służy poznaniu technik obliczeniowych (formuł matematycznych oraz algorytmów komputerowych) przeznaczonych do ekstrakcji informacji z danych opisujących wyniki eksperymentów realizowanych w obszarze energetyki. Przedstawiane metody pochodzą z zakresu zarówno potwierdzającej, jak i eksploracyjnej analizy danych. Przedmiot zapoznaje i uczy zasad wykorzystania środowiska Matlab w zakresie przeprowadzenia analizy danych i opracowania raportu. |
Pełny opis: |
Wykłady / metody dydaktyczne: werbalno-wizualna prezentacja treści programowych z wykorzystaniem technik audiowizualnych; podanie informacji teoretycznych i wskazanie przykładów ilustrujących teorię; Tematy kolejnych zajęć (po 2 godziny lekcyjne): 1. Zagadnienia wprowadzające Zasady realizacji i zaliczania przedmiotu. Cele i podział metod analizy danych. Charakterystyka narzędzi programistycznych do analizy danych: Statistica, Matlab Statistics Toolbox, pakiet R. Opis danych jednowymiarowych. 2. Zastosowanie wybranych metod wnioskowania statystycznego w analizie danych Metoda największej wiarygodności. Estymacja parametrów. Łączenie wyników o różnej dokładności. Ocena wpływu oddziaływań zewnętrznych na wynik eksperymentu. Odrzucanie danych odstających. 3. Wprowadzenie do analizy regresji Założenia estymacji parametrów modelu regresji. Rachunek skalarny modelu regresji liniowej. Jakość predykcji. 4. Regresja wieloraka Rachunek macierzowy. Przypadek hetero-ascedyczny. Macierz kowariancji estymatora parametrów. Regresja wielomianowa i krzywoliniowa. Ocena adekwatności modelu regresji. Krzywa kalibracyjna. 5. Opis danych wielowymiarowych Kowariancja jako miara współzmienności. Współczynnik korelacji liniowej Pearsona. Ilościowe znaczenie współczynnika korelacji. Reprezentacja graficzna danych wielowymiarowych: wykresy rozproszeń, gwiazdowe, twarzy Chernoffa, Andrewsa. Opis matematyczny operacji rzutowania punktu na wyróżniony kierunek. 6. Transformacja PCA Macierz kowariancji. Idea przekształcenia PCA. Dekompozycja macierzy kowariancji na wektory i wartości własne. Własności macierzy przekształcenia i danych w przestrzeni docelowej. 7. Transformacja LDA Kryterium transformacji LDA. Przebieg transformacji dla wariantu dwuklasowego. Schemat transformacji dla wariantu wieloklasowego. 8. Wprowadzenie do analizy dyskryminacji Podział metod. Klasyfikacja wzorcowa w problemie dwu klas separowalnych liniowo. Metody wyznaczania hiperpłaszczyzn rozdzielających. Przypadek wieloklasowy. 9. Problemy nieseparowalne liniowo Miary odległości w analizie danych. Klasyfikacja minimalno-odległościowa. Metoda najbliższych sąsiadów (k-NN). 10. Klasyfikacja bezwzorcowa Metoda k-średnich i metoda grupowania hierarchicznego. Kolokwium zaliczające. Ćwiczenia / metody dydaktyczne: repetytorium i utrwalenie elementów treści programowych; dyskusja; podanie zadań analizy danych do rozwiązania z wykorzystaniem komputera. Tematy kolejnych zajęć (po 2 godziny lekcyjne): 1. Rozkłady wyników eksperymentu Wykorzystanie środowiska Matlab do tworzenia raportu z analizy danych na przykładzie empirycznego wyznaczania funkcji gęstości prawdopodobieństwa. Dopasowanie rozkładu do danych eksperymentalnych. 2. Opis liczbowy jednowymiarowych wyników eksperymentu Wykorzystanie środowiska Matlab do obliczania miar położenia, rozrzutu i kształtu rozkładów danych. Miary opisu wyników zawierających dane odstające. Reprezentacja graficzna danych. 3. Przykłady zastosowań wnioskowania statystycznego w analizie danych Wykorzystanie środowiska Matlab w zagadnieniach estymacji przedziałowej. Realizacja procedury odrzucania danych odstających. Przykład weryfikacji hipotezy statystycznej. 4. Oszacowanie punktowe współczynników modelu regresji liniowej Konstrukcja macierzy predyktorów. Obliczenia współczynników prostej aproksymującej dyskretne wyniki eksperymentów Wyznaczanie wariancji parametrów modelu. 5. Oszacowanie przedziałowe współczynników modelu regresji liniowej Badanie własności modelu homo i heteroascedycznego. Wyznaczanie obszaru ufności dla wartości przewidywanych. 6. Regresja wieloraka i regresja wielomianowa Zadanie predykcji na przykładzie testowej bazy danych. Badanie stopnia dopasowania wielomianu do danych eksperymentalnych. 7. Badanie korelacji i wizualizacja danych wielowymiarowych Obliczenia współczynnika korelacji Pearsona. Badanie istotności korelacji. Metody zobrazowania danych wielowymiarowych. 8. Badanie własności transformacji PCA Obliczenia macierzy kowariancji. Wyznaczanie macierzy przekształcenia PCA. Porównanie danych z przestrzeni oryginalnej i przestrzeni docelowej. Redukcja wymiaru danych. 9. Przykłady zastosowań transformacji PCA Eksploracja testowej bazy danych z wykorzystaniem PCA. Zastosowanie PCA do stratnej kompresji obrazów. 10. Przykłady transformacji danych wielowymiarowych za pomocą LDA Przykłady rozwiązywania zadań transformacji LDA dla danych dwuwymiarowych w wariancie dwuklasowym. Zastosowanie do analizy przypadku wielowymiarowego i wieloklasowego. 11. Hiperpłaszczyzny rozdzielające Przykłady obliczeń w wariancie dwuklasowym z wykorzystaniem metody reprezentantów klas i metody aproksymacji. Implementacja modelu neuronu Rosenblatta. 12. Analiza skupień (1 godzina) Przykłady zastosowań metody k-średnich oraz metody grupowania hierarchicznego. Klasyfikacja minimalno-odległościowa. |
Literatura: |
podstawowa: 1. J. Koronacki, J. Ćwik, Statystyczne systemy uczące się, Akademicka Oficyna Wydawnicza EXIT, wyd. 2, 2008. 2. W. Kwiatkowski, Metody automatycznego rozpoznawania wzorców, Instytut Automatyki i Robotyki Wydziału Cybernetyki WAT, wyd. 1, 2001. 3. W. Klonecki, Statystyka dla inżynierów, Wydawnictwo Naukowe PWN, wyd. 1,1999. uzupełniająca: 1. M. Dobosz, Wspomagana komputerowo statystyczna analiza wyników badań, Akademicka Oficyna Wydawnicza EXIT, 2001. 2. J. R. Taylor, Wstęp do analizy błędu pomiarowego, Wydawnictwo Naukowe PWN, wyd. 1 - 1995, wyd. 2 - 1999. |
Efekty uczenia się: |
W1 / Student ma poszerzoną i pogłębioną wiedzę w zakresie zastosowania narzędzi wnioskowania statystycznego jako podstawowej metodologii analizy danych eksperymentalnych reprezentujących zjawiska lub obiekty fizyczne. / K_W01 W2 / Student zna i rozumie algorytmy wykorzystywane w systemach z obszaru specjalizacji obejmujące eksploracyjną analizę danych wielowymiarowych (data mining) ukierunkowaną na wizualizację, redukcję wymiarowości, ekstrakcję cech charakterystycznych, predykcję, klasyfikację i analizę skupień./ K_W07, K_W08 W3 / Student zna język programowania Matlab w zakresie posługiwania się specjalizowanym przybornikiem Statistics Toolbox przy wykorzystaniu komputera do wspomagania analizy danych./ K_W05 U1 / Student potrafi przygotować i przeprowadzić eksperymenty numeryczne z wykorzystaniem poznanych metod wielowymiarowej analizy danych eksperymentalnych jak PCA, LDA, k-NN i k-means. / K_U06 U2 / Student potrafi opracować szczegółową dokumentację przeprowadzonej analizy danych z wykorzystaniem narzędzi wytwarzania wersji elektronicznej raportu i narzędzi przygotowania elementów prezentacji multimedialnej oraz zawierającą omówienie uzyskanych wyników./ K_U03, K_U04 K1 / Student potrafi kreatywnie myśleć przy rozwiązywaniu problemu badawczego oraz współdziałać i pracować w małym zespole./ K_K03, K_K06 |
Metody i kryteria oceniania: |
Przedmiot zaliczany jest na podstawie: kolokwium z tematyki wykładu. Zaliczenie jest przeprowadzane w formie: pisemnej. Warunkiem dopuszczenia do zaliczenia jest: zaliczenie ćwiczeń rachunkowych. Warunkiem koniecznym do uzyskania zaliczenia ćwiczeń rachunkowych jest: uzyskanie pozytywnych ocen ze wszystkich raportów z analizy danych. Efekty W1, W2 sprawdzane są na: ćwiczeniach rachunkowych i zaliczeniu. Efekty W3, U1, U2 i K1 sprawdzane są na: ćwiczeniach rachunkowych oraz na podstawie sporządzanych przez studentów raportów z analizy danych. |
Właścicielem praw autorskich jest Wojskowa Akademia Techniczna.