Enterprise Data Management

Motivation 

Datenbanksysteme sind für das Datenmanagement aus den IT-Landschaften heutiger Unternehmen nicht mehr wegzudenken. Bedingt durch sinkende IT-Kosten für die Datenerfassung und Verarbeitung sammeln Unternehmen heutzutage unentwegt Informationen über Kunden, Produkte, Prozesse und andere wichtige Bereiche. Laut einer Studie der International Data Corporation aus dem Jahr 2011 wird sich das weltweite digitale Datenvolumen bis ins Jahr 2020 um das 50-fache vervielfachen.

Neben dem steigenden Datenvolumen haben sich auch die Erwartungen der Anwender an die Effizienz und die Flexibilität des Datenmanagements geändert. Daten sollen in allen möglichen Datenformaten durch die unterschiedlichsten Anwendungen in Echtzeit verarbeitet werden können.

Unser Enterprise Data Management Cluster (EDM) beschäftigt sich mit innovativen Ansätzen für das Unternehmensdatenmanagement, um neu aufkommende Probleme und Anforderungen zu lösen. Zentral ist dabei die Fragestellung, wie aktuelle Entwicklungen (z.B. Multi-Core Systeme, Cloud-Computing) zur Bewältigung der Herausforderungen beitragen können, beziehungsweise wie das Datenmanagement auf diese Entwicklungen angepasst werden kann und muss.

Methoden und Technologien

Um die Herausforderungen eines modernen Datenbankmanagements zu lösen, entwickelt unser EDM Cluster kontinuierlich neue Methoden in den folgenden Bereichen:

Datenmodelle: 

Relationale Datenbanken wurden ursprünglich entwickelt, um strukturierte Daten für transaktionale Anwendungen zu verarbeiten. In den letzten Jahren kamen immer mehr Anforderungen, etwa durch analytische Anwendungen und neue Datenformate, hinzu. Im EDM Cluster werden innovative Datenmodelle entwickelt, die eine gemeinsame, integrierte Erfassung und Verarbeitung Ihrer Unternehmensdaten in einem Datenmanagementsystem ermöglichen. Ein weiteres Ziel ist es, Methoden zu erarbeiten, die eine automatische Optimierung der physischen Datenmodelle bzgl. der Auslastung ermöglichen, um somit den manuellen Administrationsaufwand für Sie so gering wie möglich zu halten.

Programmiermodelle: 

Datenbanken bieten traditionell unterschiedliche Ansätze zur Verarbeitung der Daten eines Unternehmens an: 

Zum einen mit SQL, einer deklarativen Sprache, die einerseits gut optimierbar und parallelisierbar ist, andererseits aber nur eine reduzierte Möglichkeit zur Formulierung von Programmen bietet.

Zum anderen mit einem Stored-Procedure-Dialekt, einer imperativen Sprache, der erstens für den Anwender einfacher zu formulieren ist und zweitens die kompletten Möglichkeiten einer modernen Programmiersprache bietet. Allerdings sind Stored-Procedures in der Regel nicht so gut optimiert und parallelisiert wie SQL-Anfragen, was für eine effiziente Verarbeitung der immensen Datenmengen auf heutigen Plattformen eine wichtige Rolle spielt. 

Daher ist das Ziel in diesem Bereich, neue Programmiermodelle und –sprachen zu entwickeln, welche die Vorzüge der beiden Ansätze vereinen.

Datenkompression und Datensicherheit: 

Um Daten z.B. im Cloud Computing in öffentlichen Netzen effizient aber auch sicher zu verarbeiten, spielen Themen aus den Bereichen Datenkompression zur Minimierung der Datenmenge und Datenverschlüsselung zur Steigerung der Datensicherheit eine zunehmend wichtige Rolle zur schnellen und sicheren Datenübertragung. Beide Themengebiete haben die gemeinsame Eigenschaft, Daten in einer anderen Form abzulegen. Datenkompression ermöglicht es Datenbanken dabei, mehr Daten gleichzeitig im Hauptspeicher zu halten und dadurch effizient zu analysieren. Datenverschlüsselung dagegen hat das Ziel, Daten sicher und für Dritte unlesbar abzulegen. Für ein effizientes Datenmanagement ist es notwendig, die Daten trotz ihrer komprimierten bzw. verschlüsselten Form verarbeiten zu können, ohne diese vorher entschlüsseln bzw. dekomprimieren zu müssen. Hierzu entwickeln wir im EDM Cluster neue Methoden, die eine effiziente Verarbeitung der angepassten Daten ermöglichen.

Anfrageoptimierung: 

Wie bei Datenbanksystemen mit traditioneller Architektur spielt auch bei einer SQL-Anfrage die Anfrageoptimierung eine entscheidende Rolle für die effiziente Auswertung der abgerufenen Daten. Insbesondere die Plangenerierung, basierend auf vorhandenen Kardinalitäts- und Kostenabschätzungen, macht eine schnelle Auswertung hierfür möglich. Um diese Prozesse zu verbessern, erforschen wir im Cluster neue Ansätze und Methoden, welche die Effizienz der Anfrageoptionen in Datenbanksystemen zunehmend  perfektionieren.

Anwendungen

Die zuvor genannten Methoden und Technologien ermöglichen neue Anwendungen in vielen Bereichen. Beispielhaft stehen hierfür die zwei folgenden Anwendungsgebiete:

Echtzeit Business-Intelligence: 

Traditionell werden Unternehmensdaten in mehreren transaktionalen Systemen (z.B. einem ERP- oder CRM-System) erfasst und dann in regelmäßigen Abständen in spezialisierte Systeme, wie etwa ein Datawarehouse, kopiert. Durch die Entwicklung von neuen Methoden in den Bereichen Datenmodelle, Programmiermodelle und Datenkompression wird eine integrierte effiziente Verarbeitung aller Unternehmensdaten in Echtzeit ermöglicht.

Database as a Service (DaaS): 

Die Auslagerung des Datenmanagements als Dienst in die Cloud spielt für viele, darauf aufbauende IT-Dienste eine zentrale Rolle. Weiterhin bietet die Auslagerung des Datenmanagements besonders für kleine und mittelständische Unternehmen dank geringerer Kosten, besserer Verfügbarkeit und  Elastizität der Ressourcen wesentliche Vorteile gegenüber einer traditionellen IT-Landschaft. Allerdings ergeben sich für das Datenmanagement als Dienst neue Herausforderungen im Bereich Datensicherheit. Diese ist für den Schutz der Daten in öffentlichen Netzen verantwortlich und im Bereich der Programmiermodelle für die effiziente Ausnutzung der verfügbaren Ressourcen der Cloud. Die zuvor genannten Methoden aus den Bereichen Programmiermodelle und Datensicherheit bieten hierfür die nötige Forschungs- und Entwicklungsgrundlage um diese Probleme zu lösen.

 

Serviceangebote

Im Bereich der Erforschung und Entwicklung von innovativen Systemen für das Datenmanagement bietet unser EDM Cluster folgende Serviceangebote an:

Forschungskooperationen: 

Um praxisrelevante Forschungsfragen zu bearbeiten, bietet unser EDM Cluster direkte Forschungskooperationen zwischen Wissenschaft und Industrie an. Die praxisrelevanten Forschungsfragen werden dort durch industrielle Masterarbeiten bzw. Promotionen bearbeitet. Die Studierenden widmen sich dabei aktuellen Forschungsthemen in einem realistischen Problemumfeld, welches sich direkt auf eines der kooperierenden Unternehmen bezieht.

Workshops: 

Um den Austausch zwischen Industrie und Wissenschaft im Bereich Datenmanagement zu fördern, bieten unsere Workshops die perfekte Basis für eine Kommunikation zwischen Ihrem Unternehmen und den Forschungsinstituten. In den Workshops werden aktuelle praxisrelevante Probleme der Industrieunternehmen diskutiert bzw. aktuelle Forschungsergebnisse zu bestimmten Themen vorgestellt. Aus dem gemeinsamen Dialog können so neue Ideen und Forschungsansätze entstehen.