Thema
|
Literatur
(Achtung: Manche Links funktionieren nur, wenn ihr von
HU-internen IP-Adressen zugreift und für manche benötigt ihr
das in der Einführungsveranstaltung verteilte Passwort.)
|
| Email-Spam-Filterung auf
Textebene |
|
| Email-Spam-Filterung auf
Graphebene |
|
| Email- und Web-Graph
Mining
(Social
Network Mining, Community Mining) |
|
Email Management (Email
Verwaltung, Email-Beantwortung)
|
|
Named-Entity-Recognition
in
Biomedizinischen Texten (bitte Rücksprache mit Ulf für die
evtl. Aufteilung in 2 Unterthemen)
|
|
| Fact-Extraction aus
Biomedizinischen Texten (Fokus auf
Identifizierung von Protein-Protein Interaktionen) |
|
| Homonymerkennung -
Word
Sense
Disambiguation |
|
Synonymerkennung - Automatic
Thesaurus Generation
|
|
Hypernymerkennung -
Automatische
Generierung von Begriffshierarchien
|
|
| Plagiaterkennung -
Authorship
Attribution - Style Mining |
|
| Text Clustering fuer
Websuchanfragen (z.B. www.vivisimo.com) |
|
| Webseitenranking
fuer Suchanfragen anhand von Linkgraphen |
|
Link Spam-Erkennung und
-Unterdrückung
|
|
Text Mining fuer
Recommender
Systems
|
|
| Opinion Mining |
|
Novelty Detection / First
Story Detection
|
|
Entdeckung neuer Themen in
verlinkten
Textdaten (WWW)
|
|
BLOG-Mining
|
|
| Text Summarization |
- Da es zu diesem Thema sehr viel Literatur gibt, könnt
ihr selbst festlegen, wo ihr einen Schwerpunkt legen möchtet und
mit welchen Veröffentlichungen ihr euch beschäftigen
möchtet. Gute Ausgangspunkte sind die folgenden Links. DUC ist
ein Summarization-Wettbewerb, bei dem jeder Teilnehmer auch seine
Algorithmen veröffentlicht, wenn ihr euch da die
Gewinner-Veröffentlichungen anseht, findet ihr vermutlich die
State-of-the-Art-Verfahren.
- www.summarization.com
- Document Understanding
Conferences (DUC)
- DUC
2003 Overview
|
| Question Answering |
|