Please use this identifier to cite or link to this item: https://doi.org/10.48548/pubdata-612
Resource typeDissertation
Title(s)Robustness of Centrality Measures
Alternative title(s)Robustheit von Zentralitätsmaßen
DOI10.48548/pubdata-612
Handle20.500.14123/647
CreatorMartin, Christoph  1232003328
RefereeNiemeyer, Peter  1051421551
Funk, Burkhardt  0000-0001-5855-2666  105142156X
Takes, Frank  0000-0001-5468-1030
AdvisorNiemeyer, Peter  1051421551
AbstractTechnological development made it possible to store and process data on a scale not imaginable decades ago — a development that also includes network data. A particular characteristic of network data is that, unlike standard data, the objects of interest, called nodes, have relationships to (possibly all) other objects in the network. Collecting empirical data is often complicated and cumbersome, hence, the observed data are typically incomplete and might also contain other types of errors. Because of the interdependent structure of network data, these errors have a severe impact on network analysis methods. This cumulative dissertation is about the impact of erroneous network data on centrality measures, which are methods to assess the position of an object, for example a person, with respect to all other objects in a network. Existing studies have shown that even small errors can substantially alter these positions. The impact of errors on centrality measures is typically quantified using a concept called robustness. The articles included in this dissertation contribute to a better understanding of the robustness of centrality measures in several aspects. It is argued why the robustness needs to be estimated and a new method is proposed. This method allows researchers to estimate the robustness of a centrality measure in a specific network and can be used as a basis for decision making. The relationship between network properties and the robustness of centrality measures is analyzed. Experimental and analytical approaches show that centrality measures are often more robust in networks with a larger average degree. The study of the impact of non-random errors on the robustness suggests that centrality measures are often more robust if missing nodes are more likely to belong to the same community compared to missingness completely at random. For the development of imputation procedures based on machine learning techniques, a process for the evaluation of node embedding methods is proposed.

Die technologische Entwicklung machte es möglich, Daten in einem Umfang zu speichern und zu verarbeiten, der vor Jahrzehnten noch unvorstellbar war — eine Entwicklung, die auch Netzwerkdaten einschließt. Ein besonderes Merkmal von Netzwerkdaten im Gegensatz zu Standarddaten ist, dass die Objekte in einem Netzwerk, Konten genannt, Beziehungen zu (möglicherweise allen) anderen Objekten im Netzwerk haben. Das Sammeln empirischer Daten ist oft kompliziert und umständlich. Daher sind die erhobenen Daten in der Regel unvollständig und können auch andere Arten von Fehlern enthalten. Aufgrund der verflochtenen Struktur der Netzwerkdaten haben diese Fehler schwerwiegende Auswirkungen auf Netzwerkanalysemethoden. In dieser kumulativen Dissertation geht es um den Einfluss fehlerhafter Netzwerkdaten auf Zentralitätsmaße. Letzteres sind Methoden zur Bestimmung der Position eines Objekts, z.B. einer Person, im Hinblick auf alle anderen Objekte in einem Netzwerk. Bestehende Studien haben gezeigt, dass selbst kleine Fehler diese Positionen wesentlich verändern können. Der Einfluss von Fehlern auf Zentralitätsmaße wird üblicherweise mit einem Konzept namens Robustheit quantifiziert. Die in dieser Dissertation enthaltenen Artikel tragen in mehreren Aspekten zu einem besseren Verständnis der Robustheit von Zentralitätsmaßen bei. Es wird argumentiert, warum die Robustheit geschätzt werden muss. Hierzu wird eine neue Methode vorgeschlagen, die es Forschern ermöglicht, die Robustheit eines Zentralitätsmaßes in einem bestimmten Netzwerk abzuschätzen und die als Grundlage für die Entscheidungsfindung verwendet werden kann. Die Beziehung zwischen Netzwerkeigenschaften und der Robustheit von Zentralitätsmaßen wird analysiert. Experimentelle und analytische Ansätze zeigen, dass Zentralitätsmaße in Netzwerken mit einem höheren Durchschnittsgrad oft robuster sind. Die Untersuchung des Einflusses von nicht-zufälligen Fehlern auf die Robustheit legt nahe, dass Zentralitätsmaße oft robuster sind, wenn fehlende Knoten mit zur selben Community gehören. Für die Entwicklung von Imputationsverfahren, die auf Techniken des maschinellen Lernens basieren, wird ein Verfahren zur Evaluierung von Node-Embedding-Verfahren vorgeschlagen.
LanguageEnglish
KeywordsNetwork Data; Network Analysis; Netzwerkdaten; Netzwerkanalyse
Date of defense2020-06-03
Year of publication in PubData2020
Publishing typeFirst publication
Date issued2020-06-23
Creation contextResearch
NotesDas Rahmenpapier der kumulativen Dissertation enthält vier Beiträge.
Granting InstitutionLeuphana Universität Lüneburg
Published byMedien- und Informationszentrum, Leuphana Universität Lüneburg
Files in This Item:
File SizeFormat 

Diss_2020_Martin_Christoph.pdf
MD5: 74447ef1b7f7c9eee8763a07a4a57a87
License:  Nutzung nach Urheberrecht
open-access

2 MB

Adobe PDF
View/Open

Items in PubData are protected by copyright, with all rights reserved, unless otherwise indicated.

Citation formats
Access statistics

Page view(s): 11

Download(s): 5