Arbeitsgruppe Wissensmanagement

Maschinelles Lernen und Data Mining (Halbkurs, praktische Informatik)

Tobias Scheffer, Steffen Bickel

Klausurergebnisse

Viele Lösungen haben uns sehr gut gefallen. Die nach Matrikelnummern sortierten Ergebnisse finden sie hier. (Sie brauchen dafür ein Passwort, das wir Ihnen in der Vorlesung gegeben haben. Es ist das gleiche, das Sie auch zum Zugriff auf die Unterlagen verwendet haben. Wenn Sie das Passwort vergessen haben, finden Sie einen Aushang bei Frau Neugebauer und einen im Haus IV, 1. Stock. Bitte fragen Sie nicht per email nach Ihrem Klausurergebnis.) Die Klausureinsicht findet am 27.9. um 11h im Raum IV.121 statt.

Ein verbreitetes Missverständnis möchte ich noch aufklären: Aus den No-Free-Lunch-Theoremen folgt keinesfalls, dass für ein oder mehrere gegebene Lernprobleme alle Lernverfahren im Durchschnitt gleich gut sind.  Die Theoreme sagen lediglich, dass, wenn alle möglichen Zielfunktionen gleich wahrscheinlich sind (in der Realität nie der Fall), zwei beliebige Vorhersagen gleich gut sind. Sie sagen ausserdem, dass auch wenn nicht alle möglichen Zielfunktionen gleich wahrscheinlich sind, aber kein Wissen darüber vorhanden ist, welche Zielfunktionen wahrscheinlicher sind als andere, im Durchschnitt keine guten Vorhersagen getroffen werden können.

Termine:

Lehrinhalte:

Die Vorlesung beschäftigt sich mit der Konstruktion von Algorithmen, die aus Daten lernen und in Daten verborgenes Wissen identifizieren. Anwendungen für Datenanalyse-Verfahren erstrecken sich von der Vorhersage von Kreditrisiken über die Auswertung astronomischer Daten bis zu lernenden Robotern. Die behandelten Themen umfassen Klassifikation, Entscheidungsbaumverfahren,  lineare Diskriminatoren und Support-Vektor-Maschinen, Assoziationsregeln, Subgruppen, Cluster-Analyse, Scientific Discovery, Geo-Mining, Text Mining und Reinforcement-Lernen.

Empfohlene Literatur:

Folien und Unterlagen:

Erscheinen hier vor jeder Vorlesung.
  1. Einleitung; Folien.
  2. Begriffslernen, Versionenräume, Cross-Validation; Folien. Kapitel 2 in Mitchell.
  3. Entscheidungsbäume: ID3, C4.5, SLIQ, SPRINT; Folien. Kapitel 3 in Mitchell, Kapitel 8.2-8.4 in Duda, Hart & Stork. Paper zu SLIQ, SPRINT.
  4. Lineare Klassifikatoren, SVM, neuronale Netze: Folien (einseitig), Kapitel 5 und 6 in Duda, Hart & Stork.
  5. Bayessches Lernen. Folien (einseitig). Duda, Hart & Stork, Kapitel 2 und 3.
  6. Instanz-basiertes Lernen, lokale Regression. Folien (einseitig). Kapitel 8 in Mitchell, Kapitel 4.4, 4.5 in Duda, Hart und Stork.
  7. Assoziationsregeln. Folien (einseitig). Kapitel 6 in Han & Kamber, Paper zu Apriori-TID.
  8. Clusteranalyse und räumliches Data Mining. Folien (einseitig). Kapitel 10 in Duda, Hart und Stork, Kapitel 8 in Han & Kamber, Paper zu BIRCH, Paper zu GDBScan.
  9. Bewertung von Hypothesen, ROC-Analyse. Folien (einseitig)
  10. Lerntheorie, No-Free-Lunch-Theoreme, Ensembles, Language Identification. Folien (einseitig). Kapitel 9 in Duda, Hart & Stork, Kapitel 7 in Mitchell.
  11. Reinforcement-Lernen. Folien (einseitig), Kapitel 13 in Mitchell, Buch von Sutton und Barto.
  12. Text Mining und Web Mining. Folien (einseitig).
  13. Multirelationales Lernen. Folien (einseitig). Kapitel 10 in Mitchell.
  14. Zeitreihenanalyse. Folien.

Weitere Unterlagen

Übungsblätter:

Voraussetzung für die Prüfung am Ende des Semesters ist die Votierung für 2/3 der Übungsaufgaben. Die Übungsaufgaben erscheinen hier nach jeder Vorlesung. In der darauf folgenden Übung werden die Lösungen besprochen. Der Punktestand zum 9.7. kann hier abgerufen werden. Die Mindestpunktzahl für die Zulassung zur Prüfung ist 8 2/3.
  1. Übung - Ausgabe: 16.04., Besprechung: 21.04 und 23.04.
  2. Übung - Ausgabe: 21.04., Besprechung: 28.04 und 30.04.
  3. Übung - Ausgabe: 28.04., Besprechung: 05.05 und 07.05.
  4. Übung/Daten - Ausgabe: 05.05., Besprechung: 12.05 und 14.05.
  5. Übung - Ausgabe: 12.05., Besprechung: 19.05 und 21.05.
  6. Übung mit Lösung A1 - Ausgabe: 19.05., Besprechung: 26.05 und 28.05.
  7. Übung - Ausgabe: 26.05., Besprechung: 02.06 und 04.06.
  8. Übung - Ausgabe: 02.06., Besprechung: 09.06 und 11.06.
  9. Übung - Ausgabe: 10.06., Besprechung: 16.06 und 18.06.
  10. Übung - Ausgabe: 16.06., Besprechung: 23.06 und 25.06.
  11. Übung - Ausgabe: 25.06., Besprechung: 30.06 und 02.07.
  12. Übung - Ausgabe: 02.07., Besprechung: 07.07 und 09.07.
  13. Übung - Ausgabe: 08.07., Besprechung: 14.07 und 16.07.

Klausur:

Zur Klausurvorbereitung empfehlen wir folgendes Material:

Immer gesucht: studentische Mitarbeiter

Bitte bewerben Sie sich!