Arbeitsgruppe Wissensmanagement
Maschinelles Lernen und Data Mining (Halbkurs, praktische
Informatik)
Klausurergebnisse
Viele Lösungen haben uns sehr gut gefallen. Die
nach Matrikelnummern sortierten Ergebnisse finden sie hier. (Sie
brauchen dafür ein Passwort, das wir Ihnen in der Vorlesung
gegeben haben. Es ist das gleiche, das Sie auch zum Zugriff auf die
Unterlagen verwendet haben. Wenn Sie das Passwort vergessen haben,
finden Sie einen Aushang bei Frau Neugebauer und einen im Haus IV, 1.
Stock. Bitte fragen Sie nicht per email nach Ihrem Klausurergebnis.)
Die
Klausureinsicht findet am 27.9. um 11h im Raum IV.121 statt.
Ein verbreitetes Missverständnis möchte ich noch
aufklären: Aus den No-Free-Lunch-Theoremen folgt keinesfalls, dass für ein oder
mehrere gegebene Lernprobleme alle Lernverfahren im Durchschnitt gleich
gut sind. Die Theoreme sagen lediglich, dass, wenn alle möglichen Zielfunktionen
gleich wahrscheinlich sind (in der Realität nie der Fall),
zwei beliebige Vorhersagen gleich gut sind. Sie sagen ausserdem, dass
auch wenn nicht alle möglichen Zielfunktionen gleich
wahrscheinlich sind, aber kein Wissen darüber vorhanden ist,
welche Zielfunktionen wahrscheinlicher sind als andere, im Durchschnitt
keine guten Vorhersagen getroffen werden können.
Termine:
- Wenn Sie Fragen haben, kommen Sie bitte jederzeit zu uns in die
Sprechstunde. Am 23.07. machen wir außerdem eine
Sammelsprechstunde, ab 15h im Raum IV.113 oder IV.115. Danach gehen wir
zum chill-out in den Biergarten am Cafe Schönbrunn im
Friedrichshain, so gegen 18h.
- Am 03.08.2004 schreiben wir ab 9:30 im Raum 3.001 (RUD 25) eine Klausur. Sie müssen sich bei
Frau Dziwisz (IV.319) zur Prüfung anmelden, dazu müssen Sie
aber zunächst die erforderliche Mindestpunktzahl von 8 2/3 Punkten
in der Übung
erreichen. Bitte bringen Sie zur Klausur Ihren Personalausweis,
Studentenausweis, Taschenrechner, Kugelschreiber, etwas zu trinken und
gute Laune mit.
- Am 05.05. ist der Tag
der Informatik. Antrittsvorlesung um 14:30 (Raum 0'119), Bier und
Buffet ab 18h.
- Vorlesung: Mi 9-11 und Fr 9-11, RUD 26, 0'313 (Raumänderung
gegenüber Vorlesungsverzeichnis).
- Übung: Mi 11-13 und Fr 11-13, RUD 26, 0'313.
Lehrinhalte:
Die Vorlesung beschäftigt sich mit der
Konstruktion von
Algorithmen, die aus Daten lernen und in Daten verborgenes Wissen
identifizieren. Anwendungen für Datenanalyse-Verfahren erstrecken
sich von der Vorhersage
von Kreditrisiken über die Auswertung astronomischer Daten bis zu
lernenden
Robotern. Die behandelten Themen umfassen Klassifikation,
Entscheidungsbaumverfahren, lineare
Diskriminatoren und Support-Vektor-Maschinen, Assoziationsregeln,
Subgruppen,
Cluster-Analyse, Scientific Discovery, Geo-Mining, Text Mining und
Reinforcement-Lernen.
Empfohlene Literatur:
Folien und Unterlagen:
Erscheinen hier vor jeder Vorlesung.
- Einleitung; Folien.
- Begriffslernen, Versionenräume, Cross-Validation; Folien. Kapitel 2 in Mitchell.
- Entscheidungsbäume: ID3, C4.5, SLIQ, SPRINT; Folien. Kapitel 3 in
Mitchell, Kapitel 8.2-8.4 in Duda, Hart & Stork. Paper zu SLIQ,
SPRINT.
- Lineare Klassifikatoren, SVM, neuronale Netze: Folien (einseitig), Kapitel 5
und 6
in Duda, Hart & Stork.
- Bayessches Lernen. Folien
(einseitig). Duda, Hart
& Stork, Kapitel 2 und 3.
- Instanz-basiertes Lernen, lokale Regression. Folien (einseitig). Kapitel 8
in Mitchell, Kapitel 4.4, 4.5 in Duda, Hart und Stork.
- Assoziationsregeln. Folien
(einseitig). Kapitel 6
in Han & Kamber, Paper zu Apriori-TID.
- Clusteranalyse und räumliches Data Mining. Folien (einseitig). Kapitel 10 in Duda,
Hart und Stork, Kapitel 8 in Han & Kamber, Paper zu BIRCH, Paper zu GDBScan.
- Bewertung von Hypothesen, ROC-Analyse. Folien (einseitig)
- Lerntheorie, No-Free-Lunch-Theoreme, Ensembles, Language
Identification. Folien (einseitig). Kapitel 9 in
Duda, Hart & Stork, Kapitel 7 in Mitchell.
- Reinforcement-Lernen. Folien (einseitig), Kapitel
13 in Mitchell, Buch
von Sutton und Barto.
- Text Mining und Web Mining. Folien
(einseitig).
- Multirelationales Lernen. Folien (einseitig).
Kapitel 10 in Mitchell.
- Zeitreihenanalyse. Folien.
Übungsblätter:
Voraussetzung für die Prüfung am Ende des Semesters ist die
Votierung
für 2/3 der Übungsaufgaben. Die Übungsaufgaben
erscheinen hier
nach jeder Vorlesung. In der darauf folgenden Übung werden die
Lösungen
besprochen. Der Punktestand zum 9.7. kann hier abgerufen werden. Die
Mindestpunktzahl für die Zulassung zur Prüfung ist 8 2/3.
- Übung - Ausgabe:
16.04., Besprechung: 21.04 und 23.04.
- Übung - Ausgabe:
21.04., Besprechung: 28.04 und 30.04.
- Übung - Ausgabe:
28.04., Besprechung: 05.05 und 07.05.
- Übung/Daten - Ausgabe:
05.05., Besprechung: 12.05 und 14.05.
- Übung - Ausgabe:
12.05., Besprechung: 19.05 und 21.05.
- Übung mit Lösung A1 - Ausgabe:
19.05., Besprechung: 26.05 und 28.05.
- Übung - Ausgabe:
26.05., Besprechung: 02.06 und 04.06.
- Übung - Ausgabe:
02.06., Besprechung: 09.06 und 11.06.
- Übung - Ausgabe:
10.06., Besprechung: 16.06 und 18.06.
- Übung - Ausgabe:
16.06., Besprechung: 23.06 und 25.06.
- Übung - Ausgabe:
25.06., Besprechung: 30.06 und 02.07.
- Übung - Ausgabe:
02.07., Besprechung: 07.07 und 09.07.
- Übung - Ausgabe:
08.07., Besprechung: 14.07 und 16.07.
Klausur:
Zur Klausurvorbereitung empfehlen wir folgendes Material:
Immer gesucht: studentische Mitarbeiter
Bitte bewerben Sie sich!