Zu Hauptinhalt springen

Datenqualitätsmessung und -maßnahmen bei unstrukturierten Daten

Logo Datenqualit _t Klein

Abgeschlossene, laufende und zukünftige Forschungsprojekte:                               


DQMM - Datenqualitätsmessung und -maßnahmen bei unstrukturierten Daten

Start:

Juni 2015

Ende:

Dezember 2018

Projektlaufzeit:

3,5 Jahre

Projektförderung:

Freistaat Bayern     

                                                       

Kooperationspartner:

xapio GmbH, München

Prof. Dr. Mathias Klier, Universität Ulm (assoziiert)

Projektleitung:

Prof. Dr. Bernd Heinrich

 
Im Rahmen des Projekts wurden quantitative Methoden zur Messung, Steuerung und Verbesserung der datenwertorientierten Datenqualität (bspw. Korrektheit, Konsistenz, Aktualität, Vollständigkeit, Eindeutigkeit) entwickelt und vor allem anhand konkreter Anwendungsszenarien evaluiert. Diese sollten aufgrund der großen, zu bewertenden Datenmengen automatisiert anwendbar sein. Zudem sollten zur Analyse der Datenqualität ausgewählte maschinelle Lernverfahren Verwendung finden. Die Ergebnisse sind zugleich auch die Voraussetzung für die Entwicklung datengetriebener Dienstleistungen, wie bspw. eine hochgradig kontext- und nutzerbezogene Individualisierung angebotener Produkte.


DEVISE QUANT - Datenqualitätsmanagement zur Verbesserung der Informationssicherheit

Teilvorhaben: Qualitätsbewertung, Verbesserung und ökonomische Evaluation

Start:

April 2021

Ende:

Voraussichtlich März 2024

Projektlaufzeit:

3 Jahre

Projektförderung:

Bundesministeriums für Bildung und Forschung   

                 

Kooperationspartner:

Lehrstuhl für Wirtschaftsinformatik I, Prof. Dr. Günther Pernul (Sprecher)

Hochschule München

Nexis GmbH

DFN-CERT Services GmbH

Projektleitung:

Prof. Dr. Bernd Heinrich

Dr. Alexander Schiller

 
Ein zentraler Schwerpunkt des Projekts DEVISE QUANT liegt im Bereich der Datenqualität und Datenanalyse für die Informationssicherheit. Thematisch erstreckt sich dies von der Messung der Datenqualität über die Entwicklung von Datenanalysemethoden unter besonderer Berücksichtigung der Qualität der Inputdaten bis zur ökonomischen Bewertung der Datenqualität und von Datenqualitätsmaßnahmen. Im Vorhaben DEVISE sollen - basierend auf realen IAM- und CTI-Daten - Security Quality Dimensions sowie Security Quality Indicators definiert, formal spezifiziert und deren Mess- und Analysemethode festgelegt werden. Daneben sollen ausgehend von den Security Quality Indicators relevante Maßnahmen zur Verbesserung der Datenqualität abgeleitet sowie ökonomisch mit Hilfe eines Entscheidungsmodells bewertet werden.

Erfahren Sie mehr über das Projekt DEVISE


DQMM@WIKI - Datenqualitätsmessung und -maßnahmen bei Wikis und Knowledge Graphen

Start:

Oktober 2020

Ende:

Voraussichtlich September 2023

Projektlaufzeit:

3 Jahre

Projektförderung:

Freistaat Bayern                      

Kooperationspartner:

xapio GmbH, München

Prof. Dr. Mathias Klier, Universität Ulm (assoziiert)

Projektleitung

Prof. Dr. Bernd Heinrich

Dr. Alexander Schiller

 
Enterprise Wikis und Knowledge Graphen sind innovative Instrumente, um das Potenzial großer Datenmengen zu nutzen. Aufgrund der in diesem Kontext vorherrschenden Kontext vorherrschenden un-/semistrukturierten Datenformate  und der kollaborativen Erstellung ist die Sicherstellung der Datenqualität hier für Wissenschaft und Praxis von besonderer Relevanz. Das Projekt verfolgt dabei folgende Ziele:

  1. Entwicklung von Methoden und Metriken zur Messung der Datenqualität von Wikis und Knowledge Graphen
  2. Definition von Maßnahmen zur Verbesserung der Datenqualität von Wikis und Knowledge Graphen
  3. Entwicklung von Ansätzen zur automatisierten und qualitätsgesicherten Erstellung von Knowledge Graphen aus unstrukturierten Daten wie (Enterprise) Wikis

DQNGI - Datenqualität bei textuellen, Nutzer-generierten Inhalten

Start:

September 2022

Ende:

Voraussichtlich 2025

Projektlaufzeit:

3 Jahre

Projektförderung:

Deutsche Forschungsgemeinschaft

Kooperationspartner:

Prof. Dr. Mathias Klier, Universität Ulm

Projektleitung

Prof. Dr. Bernd Heinrich

Dr. Alexander Schiller

 
Im Vorhaben DQNGI werden folgende Forschungsfragen adressiert:

  1. Wie kann die DQ bei textuellen NGI automatisiert gemessen und verbessert werden?
  2. Wie lassen sich DQ-annotierte textuelle NGI bei maschinellen Lernverfahren methodisch fundiert verarbeiten?

Hierzu umfasst DQNGI zwei Teilprojekte:

Im ersten Teilprojekt werden neue Ansätze zur Messung und Verbesserung der zentralen Datenwert-orientierten DQ-Dimensionen Korrektheit/Aktualität, Vollständigkeit, Konsistenz und Identität von textuellen NGI entwickelt. Als Resultate entstehen (u. a. hinsichtlich Validität und Reliabilität) evaluierte Ansätze zur automatisierten Messung und Verbesserung der DQ sowie Datensätze, die textuelle NGI mit gemessener bzw. verbesserter DQ annotieren.

Im zweiten Teilprojekt werden neue Ansätze für maschinelle Lernverfahren entwickelt, die neben den NGI als Inputdaten auch die gemessenen bzw. verbesserten DQ-(Metrik-)Werte als Annotation methodisch verarbeiten können. Dabei werden Neuronale Netze und Random Forests als Methodentypen fokussiert, die zur Analyse von textuellen NGI weit verbreitet sind. Als Resultate entstehen neue Ansätze für maschinelle Lernverfahren, die DQ-annotierte Inputdaten verarbeiten, sowie Erkenntnisse sowohl zur (veränderten) Ergebnisgüte und -robustheit dieser Verfahren, als auch hinsichtlich deren Validität und Reliabilität.


  1. STARTSEITE UR
  2. Fakultät für Informatik und Data Science

Lehrstuhl für Wirtschaftsinformatik II

Prof. Dr. Bernd Heinrich

Team Rechts

Sekretariat

Tel.: +49 (0)941 943-6101
Fax:  +49 (0)941 943-6120
E-Mail

Universitätsstraße 31
93053 Regensburg