I00115 (I00115)
Data mining*
< 2006/2007 > 06-02-2007 t/m 01-07-2007 () L
omvang
6 ec (168 uur) (6sp) : 32 uur plenair college, 32 uur groepsgewijs college, 0 uur computerpracticum, 0 uur 'droog' practicum, 16 uur gesprekken met de docent, 32 uur onderling overleg met medestudenten (werkgroepen, projectwerk e.d.), 56 uur zelfstudie
investering
6 ec * 28 u/ec + #std * (1 + 6ec * 0.15 u/student/ec)

examinator
afdeling
tijdbesteding

prof. dr. Tom Heskes
das
50u.

speciale web-site
http://www.cs.ru.nl/~tomh/onderwijs/lrs/

 

Hoe bouw je lerende systemen? Of meer specifiek: hoe haal je relevante, interessante informatie uit enorme databases? Deze vragen komen binnen dit vak aan de orde. Je zult leren dat je, afhankelijk van het soort informatie dat je boven tafel wilt krijgen en de eigenschappen van de data, een beroep moet doen op verschillende algoritmen. Je zult zelf algoritmen implementeren en deze toepassen op bestaande datasets.

Leerdoelen

  • Wat voor vragen kan ik beantwoorden met data mining / machine learning?
  • Welke algoritmen kan ik daarvoor gebruiken?
  • Hoe implementeer ik deze algoritmen en pas ik ze toe?
  • Hoe evalueer ik de kwaliteit van mijn oplossing?
liteit van mijn oplossing?

Onderwerpen

Verschillende taken met bijbehorende algoritmes: exploratieve data analyse (histogrammen, boxplots, principal component analysis, multi-dimensional scaling), beschrijvend modelleren (clusteren, kansmodellen), classificeren (discriminant analyse, naive Bayes, bomen, naaste buren), regressie (lineair, neurale netwerken) Onderliggende principes: afstandsmaten, onzekerheid, maximum likelihood schatting, Bayesiaanse theorie, foutfuncties, zoek- en optimalisatiemethoden, cross-validatie

Werkvormen

  • Schriftelijk tentamen
  • Opdrachten
  • Project

Tentaminering

Twee schriftelijke tentamens (gesloten boek) en een project opdracht, ieder even zwaar gewogen.

Literatuur

  1. "Introduction to data mining", by Tan, Steinbach and Kumar
  2. "Data Mining: Introductory and Advanced Topics", by Dunham
  3. "Principles of data mining", by Hand, Mannila and Smyth
  4. "Data mining, concepts and techniques", by Han and Kamber
We zullen uitvoerig gebruik maken van 1. en het is dan ook aan te raden dit boek aan te schaffen.


Evaluatie: studentenquêtes http://www.cs.ru.nl/~tomh/onderwijs/lrs/; docentevaluatie
Rendement: begonnen, echt meegedaan, geslaagd met 1e kans, geslaagd totaal
Q: