Arbeitsgruppe Wissensmanagement

Seminar Text Mining und Anwendungen

Steffen Bickel, Michael Brückner, Laura Dietz, Tobias Scheffer

 

Lehrinhalte:

Text Mining beschäftigt sich mit Algorithmen, die Wissen aus Textsammlungen gewinnen. Da über 80% aller elektronischen Daten in unstrukturierter textueller Form vorliegen, sind die Methoden des Text Mining von großer Bedeutung. In diesem Seminar wollen wir Methoden und Algorithmen des Text Mining mit Bezug zu konkreten Anwendungsbereichen erarbeiten. Anwendungsbereiche von Text Mining liegen unter anderem in Biomedizin, Dokumentenmanagement, Betrugserkennung, Web-Personalisierung, Marketing, Customer Relationship Management, Recommender Systems. Teilnehmer der Veranstaltung bereiten einen Vortrag zu einem der Themenvorschläge vor und verfassen eine schriftliche Ausarbeitung.

Die Fähigkeit sicher und verständlich Vorträge zu halten, ist sehr wichtig in Studium und Beruf. In vielen Fällen ist es wichtiger wie man etwas vorträgt, als was man vorträgt. Wir wollen diese Fähigkeit gezielt trainieren. Zum einen bekommt ihr bei dem zweiten Treffen mit uns Feedback zu euren Präsentationsfolien, zum anderen bekommt ihr von uns im Anschluss an euren Vortrag Tipps, wie ihr eure Vortragstechnik verbessern könnt.

Das Seminar ergänzt sich gut mit unseren Halbkursen 'Maschinelles Lernen' und 'Maschinelle Sprachverarbeitung'.

Termine:

Wir treffen uns am Freitag den 19.10. um 13 Uhr in Raum RUD 26, 1'307. zur Vorstellung der Themen und Themenvergabe. Wer zur Themenvergabe nicht anwesend sein kann, sollte dies vorher mit uns absprechen.

Unser Zeitplan sieht so aus:

Material:


Vorraussichtliche Themen:


Thema
Literatur
(Achtung: Manche Links funktionieren nur, wenn ihr von HU-internen IP-Adressen zugreift)
Email-Spam-Filterung auf Content-Ebene
Email-Spam-Filterung auf Graphebene
Adversarial Learning für Spam Filterung
Email- und Web-Graph Mining (Social Network Mining, Community Mining)
Probabilistische Themenmodelle zur Auflösung von Autorennamen
Einflussvorhersage in Dokumentensammlungen
Webseitenranking fuer Suchanfragen anhand von Linkgraphen
Novelty Detection / First Story Detection
Weblog-Mining
Transfer Lernen und Domain Adaptation im Text Mining
Text Mining mit strukturierten Ein-/Ausgabemodellen
Ranking von Suchergebnissen mit Support Vector Maschinen

Active Learning im Text Mining

Information Retrieval von Multimedia-Inhalten