Arbeitsgruppe Wissensmanagement
Machine Learning Journal Club (Diplomanden- und Doktorandenseminar)
Tobias
Scheffer
Termin: Do, 15-17h,
Raum IV.101
Lehrinhalte:
Im Seminar diskutieren wir aktuelle Veröffentlichungen auf dem
Gebiet
Wissensentdeckung und maschinelles Lernen. Jede der zu besprechenden
Arbeiten
wird von allen Teilnehmern vorbereitet und von einem Teilnehmer
vorgetragen.
Die Vorbereitung der Arbeit durch alle Teilnehmer bildet die Grundlage
für
eine intensive inhaltliche Auseinandersetzung in der
anschließenden
Diskussion. Alle Interessierten sind herzlich eingeladen, am Seminar
teilzunehmen.
Diskutierte Arbeiten:
- Ab 2007 findet der Journal Club am Max-Planck-Institut für Informatik statt.
- 30.11.2006. Markus Weimer. Vorhersage der Qualität von Forenbeiträgen.
- 21.11.2006. Kristian Kersting. Structural relational learning.
- 23.11.2006. Matthias Schmidt. Nutzungsmöglichkeiten ubiquitärer Daten zur Überwachung von Produktionsprozessen. Studienarbeit.
- 02.11.2006. Uwe Dick. Semi-supervised Learning for Linked Data. Diplomarbeit.
- 26.10.2006: Reading Group: Expectation Propagation mit Fokus auf Gaußprozesse. (Expectation Propagation und Notes on Minka's Expectation Propagation for Gaussian Process Classification)
- 19.10.2006. Gunar Maiwald, Automatische Zitationsextraktion aus wissenschaftlichen Artikeln. Studienarbeit.
- 13.10.2006. Brainstorming - Email-Batcherkennung aus Bilddaten. (Image Spam Detection)
- 05.10.2006. Reading Group: Gaußsche Prozesse Kapitel 3.
- 18.-22.09.2006. ECML/PKDD 2006.
- 14.09.2006. Reading Group: Gaußsche Prozesse Kapitel 2.
- 07.09.2006. Steffen Bickel, PKDD Challenge und Peter Haider, MLG, Probevorträge.
- 01.09.2006. Dependency Parsing.
- 17.08.2006. Steffen Bickel, CEAS-Report.
- 10.08.2006. Isabel Drost, Dirichlet-enhanced web search.
- 03.08.2006. ECML/PKDD Design.
- 20.07.2006. NIPS reviews.
- 11.07.2006. Spam TREC 2006 und ECML/PKDD award papers.
- 06.07.2006. Spam TREC 2006
- 22.06.2006. Isabel Drost. Dirichlet-enhanced click-stream mining.
- 15.06.2006. Probevorträge ICML.
- 08.06.2006. Holger Ziekow.
- 31.05.2006. Berthold Meyer, Wolfgang Scholl.
- 24.05.2006. Thoralf Klein. CollectiveSVM.
- 16.05.2006, Peter Haider. Erkennung verdeckter Textduplikate durch diskriminatives Clustern. Diplomarbeit.
- 11.05.2006. Marco Oppel, Akronymgenerierung mit Statistischen Modellen. Studienarbeit.
- 04.05.2006. Laura Dietz. Probabilistic Topic Models for the Scientific Community.
- 28.04.2006. Peter Norvig, "AI in the Middle Between Authors and Learners".
- 10.03.2006. Rolf Schimpfky. Reputationsanalyse mit Random-Walk-Prozessen. Diplomarbeit.
- 23.02.2006. Steffen Bickel, NPB-Sprachmodell. ICML reviews.
- 16.02.2006. Steffen Bickel. Text Mining in Customer Help Desk-Anfragen/Antworten.
- 09.02.2006. Michael Brückner. Spam, Phishing & Co -
Aktuelle Problemstellungen. [1]
- 02.02.2006. Steffen Bickel, Michael Brückner. ICML projects.
[projekt2]
- 26.01.2006. Ulf Brefeld, Thomas Gärtner. ICML projects [1][2].
- 19.01.2006. Isabel Drost. Developing
Intelligent Search Engines.
- 12.01.2006. Andreas Nürnberger
- 15.12.2005. Melanie Hartmann. Task switching in audiobasierten
Systemen.
- 08.12.2005. Peter Haider. Erkennung homologer
Proteinpaare mit Support Vector Machines. Studienarbeit.
- 01.12.2005. Christoph Büscher. Halbüberwachtes
Lernen zur Named Entity Recognition mit der
Hidden-Markov-Support-Vektor-Maschine. Diplomarbeit.
- 15.11.2005. Tobias Scheffer
- 14.11.2005. Tobias Scheffer
- 10.11.2005. Steffen Bickel, EMNLP-Report.
- 03.11.2005. Marek Musial. Neuronale
biologisch inspirierte Steuerung für einen biologischen Roboter.
- 28.10.2005. Isabel Drost. 22C3 Vortragsskizze.
- 27.10.2005. Christin Schäfer und Pavel Lavkov. Visualization of anomaly
detection using prediction sensitivity. Intrusion detection in unlabeled
data with quarter-sphere Support Vector Machines.
- 26.10.2005. Isabel Drost, ECML-Report.
- 20.10.2005. Steffen Bickel, ICML-Report, Teil 2.
- 18.10.2005. Ulf Brefeld. ICML-Report, Teil 1.
- 29.09.2005. Stefan Träger. Korpora aus dem Netz: Die
Erstellung eines Fachkorpus aus Webseiten und Möglichkeiten der
sprachwissenschaftlichen Nutzung. Magisterarbeit.
- 26.09.2005 und 28.09.2005. Probevorträge ECML.
- 21.09.2005. Probevorträge ECML / EMNLP.
- 16.09.2005, Sambu Seo, Clustering
and Prototype Based Classification. PhD Thesis.
- 09.09.2005, Sebastian Ordyniak, Probabilistisch latent
semantisches Indexieren mit mehreren Sichten für das Information
Retrieval. Studienarbeit.
- 01.09.2005, Machine Learning Business Models.
- 26.08.2005, Isabel Drost, Link Spam:
AIRWeb 05 , WWW 05. Rolf Schimpfky: Suche von kompetenten Personen
- 19.08.2005, Martina Brechler, Analyse des
Navigationsverhaltens verschiedener Nutzergruppen auf Websites mit
Hilfe des Web Usage Mining und Ontology Learning. Diplomarbeit.
- 12.08.2005, Birgit Wandrei, Satzvervollständigung
mit latent
semantischer Analyse. Diplomarbeit.
- 05.08.2005, Thomas Posner, Interaktive
Satzgenerierung mit
N-Gramm-Sprachmodellen: Evaluierung der Praxistauglichkeit.
Diplomarbeit
- 28.07.2005. Probevorträge Michael, Steffen, Ulf.
- 14.07.2005. Steffen Bickel, Spam.
- 07.07.2005. ECML/PKDD reviews.
- 23.06.2005. Ulf Brefeld: Thomas Gärtner, multi-view ridge
regression.
- 16.06.2005. Felix Salfner, Predicting
Failures with Hidden Markov Models. EDCC 2005.
- 09.06.2005. KDD Cup 2005.
- 02.06.2005, Szymon Jaroszewicz. Fast
Discovery of Unexpected
Patterns in Data, Relative to a Bayesian
Network, SIGKDD 2005.
- 19.05.2005, Gong-Show Preview.
- 12.05.2005, ECML Projects A,
B.
- 04.05.2005, Ulf Brefeld, Wahrnehmung.
- 28.04.2005, ICML Reviews.
- 21.04.2005, ICML Reviews.
- 14.04.2005, Hans-Dieter Burkhard, RoboCup.
- 07.04.2005, Alex
Nareyek: Artificial Intelligence and Computer
Games - State of the Art and Challenges.
- 31.03.2005, Pedro Domingos, Adversarial
Classification. SIGKDD 2004.
- 24.03.2005, Birgit Wandrei, Satzvervollständigung
mit latent
semantischer Analyse. Gildea, Hofmann, Topic-based
language models using EM, EUROSPEECH 99.
- Mittwoch, 16.03.2005, Diemo Urbig: GITTINS-Index,
Reinforcement-Lernen und
der Support-Confidence-Tradeoff.
- 03.03.2005. Ulf
Brefeld: ICML-Projekt, Isabel
Drost: ICML-Projekt; Steffen Bickel:
ICML-Projekt. Isabel Drost: GfKl-Probevortrag
- 24.02.2005. Stefan Träger, Korpusextraktion
aus dem Web. Baroni & Bernardini, BootCaT. Tobias Scheffer:
Knuth, Larrabee, Roberts, Mathematical
writing.
- 17.02.2005. Isabel Drost: SIGKDD-Projekt.
Tobias Scheffer: SIGKDD-Projekt.
- 10.02.2005. Victor Uc: Rosenstein & Barto, Supervised
Learning Combined with an Actor-Critic Architecture. Lakoudakis
& Parr, Reinforcement
Learning as Classification: Leveraging Modern Classifiers.
- Montag, 7.2.2005, 12h. Achim Hoffmann, Extracting Positive
Attributions from Scientific Papers (Abstract).
- Donnerstag, 27.01.2005, 15h. Thomas Posner, Nächste-Nachbarn-Klassifikatoren
zur automatisierten Email-Beantwortung, Studienarbeit.
- 19.01.2005, Steffen Bickel, Peter Haider, Tobias Scheffer, Sentence
completion with n-gram models.
- 12.01.2005, Christian Siefkes.
Incremental
Information Extraction Using Tree-based Context Representations.
Sixth International Conference on Intelligent Text Processing and
Computational Linguistics (CICLing-2005).
- Donnerstag, 06.01.2005. Rolf
Schimpfky, Data
Compression with T-Codes.
- 15.12.2004, Steffen Bickel, Machine Learning Jam-Session.
- 08.12.2004, Steffen Bickel, Multi-View
Mixture Models.
- 01.12.2004, Ulf Brefeld, Consensus Perceptron Learning draft und draft2. Xu,
L., Neufeld, J., Larson, B. and Schuurmans, D. (2004)
Maximum margin clustering.
To appear in Advances in Neural Information Processing Systems
(NIPS*2004)
nips04.ps.gz
- 24.11.2004, Steffen Bickel, ECML 2004 Conference
Report. Rosen-Zvi,
Griffiths,
Steyvers and Smyth: The Author-Topic Model
for Authors and Documents, Proceedings of the Conference on
Uncertainty in Artificial Intelligence volume 21, (2004). Sinkkonen,
Nikkilä, Lahti and
Kaski. Associative
Clustering. ECML 2004.
- 17.11.2004, Steffen Bickel, ICDM 2004 Conference Report.
- 10.11.2004, Ulf Brefeld: ICML 2004
Conference Report.
- 03.11.2004, (Isabel Drost): S. Lin
und H. Chalupsky: Using
Unsupervised Link Discovery Methods to Find Interesting Facts and
Connections in Bibliography Dataset. SIGKDD Explorations
5(2), 2004. S. Hill and F. Provost: The
Myth of the Double-Blind Review? Author Identification Using Only
Citations. SIGKDD Explorations, 5(2), 2004.
- 27/28.10.2004, Steffen Bickel: Multi-view
clustering. ICDM-2004.
- 27.10.2004, Christoph
Büscher,
Lernen aus gelabelten Sequenzdaten mit dem
Hidden-Markov-Perzeptron. Studienarbeit, 2004.
- 20.10.2004, Tobias Scheffer: Sternstunden der
Wissenschaft.
- 20.08.2004, ca. 14h, Johannes
Fürnkranz: ROC 'n' rule
learning - towards a better understanding of covering algorithms.
Machine Learning Journal, in print.
- 22.07.2004, Holger
Schöner: Working with
real-world data sets - preprocessing and
prediction with large, heterogenous, noisy, and incomplete data sets.
- 19.07.2004, 14h. Chengqui
Zhang: Data Mining, Multi-Agent Systems, and Their Application in
the Stock Market. Abstract.
Multi-Database Mining. Book.
- 01.07.2004. Thomas
Förster: NIPClassificator.
Roark and Charniak, Noun-phrase
cooccurrance statistics for semi-automated semantic lexicon construction,
ACL 1998 & Berland and Charniak, Finding parts
in very large corpora, ACL 1999.
- 24.06.2004, 1: Myra
Spiliopoulou. Graubitz & Spiliopoulou: Deriving multiple topics to label
small document regions. Karsten Winkler and Myra Spiliopoulou. Extraction
of Semantic XML DTDs from Texts Using Data Mining Techniques.
K-CAP 2001. 2: Annett Krakisch & Bettina Berendt: Cultural
determinants of search behavior on websites. IWIPS Conf. on
Culture, Trust, and Design Innovation.
- 17.06.2004, Klaus Obermayer:
S. Hochreiter
and K. Obermayer. Classification,
regression, and feature selection on matrix.
Technical report, Technische Universität Berlin, Fakultät
für Elektrotechnik und Informatik, 2004.
- 10.06.2004, Laurenz Wiskott.
Is
slowness a learning principle of the visual cortex? Zoology
106(4):373-382.
- 27.05.2004, ECML
Gong Show; pro Paper drei Minuten
Präsentation, drei Minuten Diskussion der Reviews.
Danach:
ICDM-Projekte Bettina/Annett Kralisch, Isabel, Steffen.
- 13.05.2004, Szymon
Jaroszewicz.
Interestingness of Frequent Itemsets Using Bayesian Networks as
Background Knowledge & Pruning Frequent Patterns
Using Bayesian Networks as Background Knowledge — A Sampling-Based
Approach.
- 06.05.2004, (Bettina
Berendt): Salzberg, On Comparing
Classifiers: Pitfalls to Avoid and a Recommended Approach. Data
Mining and Knowledge Discovery 1(3), 1997. David D. Jensen,
Knowledge evaluation: statistical evaluations, In Handbook of data
mining and knowledge discovery (2002). E. Alpaydin, "Combined
5x2cv F test for comparing supervised classification learning algorithms,"
Neural Computation, vol. 11, no. 8, pp. 1885--1892, 1999. Presentation.
- 29.04.2004, kein JC wegen Vortrag
Prof. Siekmann.
- 22.04.2004, ECML Projects, Steffen Bickel, Ulf Brefeld,
Isabel Drost.
- 16.04.2004, Jörg
Hakenberg: BioCreative
Workshop Report. Handouts,
Tools,
Presentation.
- 08.04.2004, (Steffen Bickel):
F. Peng, D. Schuurmans and S. Wang: Augmenting Naive
Bayes
Text
Classifier Using Statistical N-Gram Language Modeling, to
appear
on Journal of Information Retrieval.
- 01.04.2004, (Isabel
Drost): L. Getoor, N. Friedman, D. Koller, B. Taskar. Learning
Probabilistic Models of Link Structure, Journal of Machine Learning
Research,
2002; Lise Getoor, Link
Mining. SIGKDD Exploration 5, 2003.
- 25.03.2004, Tobias
Scheffer and Stefan Wrobel. Finding
the Most Interesting
Patterns in a Database Quickly by Using Sequential Sampling. Journal
of Machine Learning Research 3:833-862. 2002.
- 11.03.2004, Markus Weber: Environmental Conflict: Feasibility
study on the use of neural networks. Presentation. Wolf, Yoffe,
Giordano: International Waters,
Identifying Basins at Risk, Water Policy 5, 2003. Schwartz and
Randall, An Abrupt Climate
Change Scenario and Its Implications for United States National Security.
- 04.03.2004, ICML reviews. p-1 (Isabel Drost), p-2 (Steffen
Bickel, Isabel
Drost), p-3 (Christoph
Büscher, Steffen Bickel), p-4 (Ulf Brefeld), p-5 (Ulf Brefeld). Review form.
- 26.02.2004, (Christoph
Büscher): David A. Ross and Richard
S. Zemel: Multiple
Cause Vector Quantization. Gharhamani, Zoubin: Factorial
Learning and the EM algorithm.
- 19.02.2004, (Mark-A.
Krogel): M.-A. Krogel, S. Rawles, F.
Zelezný, P. A. Flach, N. Lavrac, and S.
Wrobel. Comparative Evaluation of
Approaches to Propositionalization. Proceedings of the
Thirteenth International Conference on Inductive Logic Programming (ILP),
2003.
& M.-A. Krogel and S. Wrobel. Facets
of Aggregation Approaches to Propositionalization.
Proceedings of the
Work-in-Progress Track at the Thirteenth International Conference on
Inductive Logic Programming (ILP), 2003.
- 12.02.2004, Harald
Bartel, Time
series prediction, support vector
regression.
- 05.02.2004, (Martina Brose): Maedche,
Pekar, Staab: Ontology learning part one - discovering taxonomic
relations from the Web. Web intelligence 2002 & Ypma and
Heskes: Automatic
categorization of web pages with mixtures of hidden Markov models.
WEBKDD 2002.
- 29.01.2004, (Stefan
Harmeling): Stefan Harmeling, Andreas Ziehe, Motoaki Kawanabe, and
Klaus-Robert Müller, Kernel-based
nonlinear blind source separation. Neural Computation 15, 1089-1124
(2003).
- 23.01.2004, ICML projects: Steffen Bickel, Ulf Brefeld.
- 15.01.2004, (Bettina
Berendt): X.
Yan and J. Han, “CloseGraph:
Mining Closed Frequent Graph Patterns”, Proc. 2003 ACM SIGKDD Int.
Conf. on
Knowledge Discovery and Data Mining (KDD'03), Washington, D.C., Aug.
2003.
- 08.01.2004, (Isabel Drost):
J. Kleinberg. Authoritative
sources in a hyperlinked environment.Proc. 9th ACM-SIAM Symposium
on
Discrete Algorithms, 1998. Extended
version in Journal of the ACM
46(1999). & Page and Brin, The PageRank
citation ranking: Bringing order to the web.& Corinna
Cortes, Daryl Pregibon, and Chris Volinski: Communities
of Interest. IDA-2001.
- 18.12.2003, (Thomas Posner): Cozman, Cohen,
Cirelo: Semi-supervised
learning of mixture models. ICML-2003.
- 11.12.2003, Stephan
Heymann et al., Rechnergestütze
Suche nach Korrelationen in komplexen Datensätzen der
Biowissenschaften.
- 04.12.2003, Korinna
Grabski: Entwicklung
eines Verfahrens zur Bildung statistischer Textmodelle für die
Vorhersage
von Satzfortsetzungen.
- 27.11.2003, Diemo Urbig: Attitude Dynamics
With
Limited Verbalisation Capabilities. Journal of Artificial
Societies
and Social Simulation (JASSS), 6(1), 2003.
- 13.11.2003, (Steffen Bickel)
Russel, Norvig.Kapitel
über Bayesian Networks in Artificial Intelligence, A Modern
Approach.
- 06.11.2003, (Ulf Brefeld)
Yasemin Altun, Ioannis Tsochantaridis,
Thomas
Hofmann. Hidden
Markov Support Vector Machines. Proceedings of the International
Conference on Machine Learning (ICML), 2003.
- 23.10.2003, (Tobias Scheffer):
David Wolpert. The
supervised
learning No-Free-Lunch Theorems. In Proceedings of the Sixth Online
World
Conference on Soft Computing in Industrial Applications, 2001; The lack of a priori distinction between
learning
algorithms.
- 16.10.2003, Steffen Bickel.
Optimierung
von Sicherheitsbeständen für Supply-Chains mit genetischen
Algorithmen.
- 01.10.2003, Ulf Brefeld,
Peter Geibel and Fritz Wysotzki. Support
Vector Machines with Example Dependent Costs. In: N. Lavrac, D.
Gamberger,
L. Todorovski, H. Blockeel (Eds.), "Proceedings of the 14th European
Conference
on Machine Learning, ECML 2003".
Vorschläge:
- 15.07.2004, Klaus-Robert
Müller: Tsuda, Kawanabe, Rätsch, Sonnenburg,
Müller, Discriminative
Fisher Kernels, Neural Computation 14(10): 2397-2414, 2002. Asymptotic properties of Fisher
kernels. (org).
- Kristina Toutanova,
Christopher Manning, Andrew Ng: Learning
Random Walks for Inducing Word Dependency Distributions [Abstract]
[Full
Paper]
- Sambu Seo and Klaus Obermayer. Self-organizing maps and
clustering on matrix data. To appear in Neural Networks.
- Mooney, R., Melville, P., Tang, L., Shavlik, J., Dutra, I. and
Page, D. (2003). Relational
Data Mining with Inductive Logic
Programming for Link Discovery. In H. Kargupta and A. Joshi (Ed.s),
Data Mining: Next Generation Challenges and Future Directions.
- Amy McGovern, Lisa Friedland, Michael Hay, Brian Gallagher, Andrew Fast, Jennifer Neville,
and David Jensen
(2003) Exploiting Relational Structure to
Understand Publication Patterns in High-Energy Physics , SIGKDD
Explorations 5(2), 2004. [kdl_kddcup2003.pdf
].
- Stable
algorithms for link analysis,
Andrew Y. Ng, Alice X. Zheng and Michael Jordan.
SIGIR 2001.
- Hans-Dieter
Burkhard: Fault-tolerant
self-organization
by case-based reasoning & Real-time
control for autonomous mobile robots. Fundamenta Informaticae 34,
2002.
- Stefan Mutter: Using
Classification to Evaluate the Output of Association Rule Mining. (Submitted).
Classification
using Association Rules.(Diplomarbeit).
- Heymann, Rieger et al., Efficient
functional
assessment of novel alternative spliceforms in silico.
- T. Joachims, Transductive
Learning via Spectral Graph Partitioning, Proceedings of the
International Conference on Machine Learning (ICML), 2003.
- Justin Basilico and Thomas Hofmann: A
Joint Framework for Collaborative and Content Filtering. SIGIR 2004.
- Max-Margin
Markov Networks; Ben Taskar, Carlos Guestrin, Daphne Koller;
NIPS 2003, Vancouver, Canada, December 2003.
Wir haben keinen Einfluss auf die Inhalte der Seiten,
auf die wir hier verweisen. Wir haben die hier aufgeführten
Arbeiten im Rahmen unserer Forschungsarbeit besprochen, distanzieren
uns aber von den Inhalten.