Arbeitsgruppe Wissensmanagement

Seminar Text Mining und Anwendungen

Tobias Scheffer, Steffen Bickel, Isabel Drost


Achtung: Dies ist die Webseite des Seminars von 2004, die aktuelle Seite vom gleichnamigen Seminar 2005 könnt ihr hier erreichen.


Termine:

Di, 9-11, RUD 26, 1'308 (einmaliger Termin zur Einfuehrung und Themenvergabe am 19.10.2004)
Das Seminar findet als Blockseminar am 08.02.2005 - 10.02.2005 statt (Achtung: Terminänderung).

Unser Zeitplan sieht so aus:

Lehrinhalte:

Text Mining beschäftigt sich mit Algorithmen, die Wissen aus Textsammlungen gewinnen. Da über 80% aller elektronischen Daten in unstrukturierter textueller Form vorliegen, sind die Methoden des Text Mining von großer Bedeutung. In diesem Seminar wollen wir Methoden und Algorithmen des Text Mining mit Bezug zu konkreten Anwendungsbereichen erarbeiten. Anwendungsbereiche von Text Mining liegen unter anderem in Biomedizin, Dokumentenmanagement, Betrugserkennung, Web-Personalisierung, Marketing, Customer Relationship Management, Recommender Systems. Teilnehmer der Veranstaltung bereiten einen Vortrag zu einem der Themenvorschläge vor und verfassen eine schriftliche Ausarbeitung.


Hinweise zum Koreferat:

Das Koreferat sollte direkt nach dem eigentlichen Vortrag zu dem Thema gehalten werden (ca. 5 Minuten).

Zu folgenden Fragen könnt ihr Stellung nehmen:


Material:


Themen:


Thema
Betreuung
Literatur
Email-Spam-Filterung auf Textebene Tobias Scheffer
Email und Web-Graph Mining (Spam-Filterung auf Graphebene, Social Network Mining, Community Mining) Tobias Scheffer
Email Management (Email Verwaltung, Email Filing, Email-Beantwortung) Steffen Bickel
Named-Entity-Recognition in Biomedizinischen Texten Tobias Scheffer
Fact-Extraction aus Biomedizinischen Texten (Fokus auf Identifizierung von Protein-Protein Interaktionen) Tobias Scheffer
Homonymerkennung - Word Sense Disambiguation Steffen Bickel
Synonymerkennung - Automatic Thesaurus Generation
-
Hypernymerkennung - Automatische Generierung von Begriffshierarchien
Isabel Drost
Plagiaterkennung - Authorship Attribution - Style Mining -
Text Clustering fuer Websuchanfragen (z.B. www.vivisimo.com) Isabel Drost
Webseitenranking fuer Suchanfragen anhand von Linkgraphen Isabel Drost
Text Mining fuer Recommender Systems (Teil 1, Teil 2) Isabel Drost
Opinion Mining Steffen Bickel
Trend Mining in textuellen Datenstroemen Steffen Bickel
Novelty Detection / First Story Detection
Steffen Bickel
Entdeckung neuer Themen in verlinkten Textdaten (WWW)
Isabel Drost
Text Summarization Tobias Scheffer
Semantic Web Steffen Bickel
Question Answering -
Maschinelle Übersetzung Steffen Bickel