Tento předmět je zaměřen na praktickou práci s daty a geodaty, jejich úpravu, formátování, transformace. Součástí bude praktické představení základních statistických metod pro redukci dimenzionality a jiných multivariačních metod analýzy dat jako faktorová, diskriminační a shluková analýza a rozhodovací stromy. Představeny budou také základy data miningu. S výjimkou představení výše uvedených metod bude hlavně kladen důraz na interpretace zjištěných výsledků a maximální vytěžení informací z dat a geodat. Téměř výhradní software, který budeme celý semestr používat bude R.
Harmonogram semestru
- Postupy úpravy a přípravy dat a geodat pro zpracování
- Chyby v datech, geodatech a jejich řešení
- Základy práce a operace v R
- R a práce s geodaty
- Analýza hlavních komponent a intepretace výsledků
- Faktorová analýza a interpretace výsledků
- Diskriminační analýza a interpretace výsledků
- Shluková analýza a interpretace výsledků
- Rozhodovací stromy a interpretace výsledků
- Práce s vektorovými daty v R
Podmínky udělení zápočtu
Zápočet je ohodnocen v bodovém rozpětí 51 – 100 bodů. Jednotlivé body je možné získat splněním několika povinností běheme semestru a celkově je vše shrnuto v tabulce níže. Během minulých let jsem se ujistil v tom, že vyšší nároky kladené na vás studenty jsou vidět v následujících letech. Celkem během semestru budete vypracovávat 3 programy, které jsou zaměřeny na jednotlivé oblasti dle harmonogramu cvičení. Každá práce, kterou odevzdáte jako výsledek cvičení (program), bude hodnocena ze dvou hledisek:
- Jak byly splněny zadané úkoly (jaká je míra shody mezi požadavky stanovenými v úkolech a tím, co jste odevzdali).
- Odborná kvalita dodaných výstupů (protokol, mapy, prezentace a další) odpovídající studentům 4. ročníku.
Zdroj bodů | Počet bodů |
---|---|
Program 1 – Faktorová analýza | 15-24 |
Program 2 – Shluková analýza | 15-24 |
Program 3 – Rozhodovací stromy | 15-24 |
Docházka | 24-28 |
Program bude může být vrácen k dopracování max. 1x, pokud se v něm budou i nadále vyskytovat chyby, bude vracen i nadále, ale s bonusovým úkolem navíc tak dlouho, dokud nebude vše v naprostém pořádku. Za každé vrácení bude rozsah bodového hodnocení snížen o 2 body.
Termín odevzdání programů bude vždy uveden, stejně jako termín pro opravu. Pro získání zápočtu je třeba úspěšně odevzdat všechny programy. Programy odesílejte v editovatelném formátu (doc, docx apod.). Maximální povolená neúčast jsou 2 cvičení za semestr, v případě větší neúčasti nebude udělen zápočet. Ke komunikaci používejte výhradně školní e-mail. Předmět (Subject) e-mailu spojeného s výukou bude IGD.
Cvičení je vytvořeno v rámci projektu Inovace bakalářských a magisterských studijních oborů na Hornicko-geologické fakultě VŠB-TUO pod číslem CZ.1.07/2.2.00/28.0308. Tento projekt je realizován za spoluúčasti EU.