|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Zur Hauptseite der Ringvorlesung KurzzusammenfassungenProf. Gerhard WeikumIntelligente und effiziente Suche auf semistrukturierten Daten Im Zeitalter der Informationsexplosion findet man in zunehmendem Maße semistrukturierte Daten in XML und anderen Formaten, beispielsweise in großen Intranets, digitalen Bibliotheken, wissenschaftlichen Datenarchiven und auch im Web. Häufig möchte man mehrere Datenquellen dieser Art durchsuchen und trifft dabei auf das Problem, dass es kein global einheitliches Datenbankschema gibt; man hat es vielmehr mit hochgradig heterogenen Daten zu tun, die bezüglich Struktur, Annotationen (z.B. XML-Tags) und Terminologie stark variieren. Boolesche Datenbankanfragen, die man in XQuery oder XPath formulieren kann, sind dann häufig unbefriedigend, weil sie entweder zu wenige oder viel zu viele Resultate liefern. Stattdessen benötigt man ein auf Relevanz- oder Ähnlichkeitsmaßen beruhendes Ranking von Anfrageresultaten, und dafür wiederum müssen Datenbankverfahren mit Techniken des dokumentenorientierten Information Retrieval kombiniert werden. Der Vortrag stellt mit den in Saarbrücken entwickelten Systemen XXL und COMPASS einen Ansatz dieser Richtung vor. Es wird gezeigt, wie man - unter anderem mit Hilfe von quantifizierten ontologischen Konzeptbeziehungen - heterogene XML-Daten mit hoher Präzision und Ausbeute suchen kann. Zur effizienten Ausführung von Anfragen kommen spezifische Indexstrukturen, insbesondere der Pfadindex HOPI (Two-Hop-Based Path Index), sowie approximative Algorithmen für Top-k-Ähnlichkeitsanfragen mit probabilistischen Garantien zum Einsatz. Wesentliche Konzepte der XML-Suche lassen sich auch auf - automatisch und dynamisch in XML konvertierte - HTML- und PDF-Daten aus dem Web sowie auf Deep-Web-Portale anwenden. Prof. Alfons Kemper AutoGlobe: Automatische Administration von dienstbasierten Datenbankanwendungen Derzeit lässt sich ein Trend weg von monolithischen Systemen hin zu Service Oriented Architectures (SOAs) beobachten. Dieser Paradigmenwechsel erfordert neue Administrationstechniken, um die auf SOAs basierenden verteilten Datenbankanwendungen zuverlässig und kostengünstig betreiben zu können. Zu diesem Zweck entwickeln wir in Kooperation mit der ACI-Abteilung von SAP neue Selbstadministrierungskonzepte. Die Grundlage hierfür bilden die Virtualisierung von Hardware und Diensten, sowie ein kontinuierliches Monitoring. Dadurch ist es möglich, die Verteilung der Dienste auf die zur Verfügung stehende Hardware durch statische und dynamische Allokationstechniken zu optimieren. Statische Allokationsalgorithmen liefern eine optimierte a priori Verteilung der Dienste auf die Hardware. Dazu werden Dienste mit komplementären Ressourcenanforderungen möglichst gemeinsam auf einem Rechner ausgeführt. Eine rein statische Optimierung kann allerdings nicht zeitnah auf unvorhersagbare Ereignisse, wie etwa Überlast- oder Fehlersituationen, reagieren. Deshalb setzen wir zusätzlich eine auf Fuzzy-Logik basierende Kontrollkomponente ein, die zur Laufzeit dynamisch Anpassungen der Dienstallokation vornimmt. Beispielsweise werden abgestürzte Dienste neu gestartet und Überlastsituationen durch Hinzunahme weiterer Instanzen oder den Umzug einer Instanz auf einen leistungsfähigeren Rechner behoben. Die vorgestellten Technologien stellen damit einen ersten Schritt in Richtung eines durchgängigen Quality of Service-Managements (QoS-Management) in einer derartigen verteilen Web-Service basierten Informationsverarbeitungs-Infrastruktur dar. AutoGlobe ist die prototypische Umsetzung der in diesem Beitrag beschriebenen Konzepte für eine adaptive Infrastruktur, die sich durch Selbstkonfiguration, Selbstoptimierung und eigenständige Fehlerbehebung auszeichnet. Die grundlegenden hier vorgestellten Konzepte wurden bereits in SAP NetWeaver integriert. |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||