Please use this identifier to cite or link to this item:
https://doi.org/10.48548/pubdata-612
Resource type | Dissertation |
Title(s) | Robustness of Centrality Measures |
Alternative title(s) | Robustheit von Zentralitätsmaßen |
DOI | 10.48548/pubdata-612 |
Handle | 20.500.14123/647 |
Creator | Martin, Christoph 1232003328 |
Referee | Niemeyer, Peter 1051421551 Funk, Burkhardt 0000-0001-5855-2666 105142156X Takes, Frank 0000-0001-5468-1030 |
Advisor | Niemeyer, Peter 1051421551 |
Abstract | Technological development made it possible to store and process data on a scale not imaginable decades ago — a development that also includes network data. A particular characteristic of network data is that, unlike standard data, the objects of interest, called nodes, have relationships to (possibly all) other objects in the network. Collecting empirical data is often complicated and cumbersome, hence, the observed data are typically incomplete and might also contain other types of errors. Because of the interdependent structure of network data, these errors have a severe impact on network analysis methods. This cumulative dissertation is about the impact of erroneous network data on centrality measures, which are methods to assess the position of an object, for example a person, with respect to all other objects in a network. Existing studies have shown that even small errors can substantially alter these positions. The impact of errors on centrality measures is typically quantified using a concept called robustness. The articles included in this dissertation contribute to a better understanding of the robustness of centrality measures in several aspects. It is argued why the robustness needs to be estimated and a new method is proposed. This method allows researchers to estimate the robustness of a centrality measure in a specific network and can be used as a basis for decision making. The relationship between network properties and the robustness of centrality measures is analyzed. Experimental and analytical approaches show that centrality measures are often more robust in networks with a larger average degree. The study of the impact of non-random errors on the robustness suggests that centrality measures are often more robust if missing nodes are more likely to belong to the same community compared to missingness completely at random. For the development of imputation procedures based on machine learning techniques, a process for the evaluation of node embedding methods is proposed. Die technologische Entwicklung machte es möglich, Daten in einem Umfang zu speichern und zu verarbeiten, der vor Jahrzehnten noch unvorstellbar war — eine Entwicklung, die auch Netzwerkdaten einschließt. Ein besonderes Merkmal von Netzwerkdaten im Gegensatz zu Standarddaten ist, dass die Objekte in einem Netzwerk, Konten genannt, Beziehungen zu (möglicherweise allen) anderen Objekten im Netzwerk haben. Das Sammeln empirischer Daten ist oft kompliziert und umständlich. Daher sind die erhobenen Daten in der Regel unvollständig und können auch andere Arten von Fehlern enthalten. Aufgrund der verflochtenen Struktur der Netzwerkdaten haben diese Fehler schwerwiegende Auswirkungen auf Netzwerkanalysemethoden. In dieser kumulativen Dissertation geht es um den Einfluss fehlerhafter Netzwerkdaten auf Zentralitätsmaße. Letzteres sind Methoden zur Bestimmung der Position eines Objekts, z.B. einer Person, im Hinblick auf alle anderen Objekte in einem Netzwerk. Bestehende Studien haben gezeigt, dass selbst kleine Fehler diese Positionen wesentlich verändern können. Der Einfluss von Fehlern auf Zentralitätsmaße wird üblicherweise mit einem Konzept namens Robustheit quantifiziert. Die in dieser Dissertation enthaltenen Artikel tragen in mehreren Aspekten zu einem besseren Verständnis der Robustheit von Zentralitätsmaßen bei. Es wird argumentiert, warum die Robustheit geschätzt werden muss. Hierzu wird eine neue Methode vorgeschlagen, die es Forschern ermöglicht, die Robustheit eines Zentralitätsmaßes in einem bestimmten Netzwerk abzuschätzen und die als Grundlage für die Entscheidungsfindung verwendet werden kann. Die Beziehung zwischen Netzwerkeigenschaften und der Robustheit von Zentralitätsmaßen wird analysiert. Experimentelle und analytische Ansätze zeigen, dass Zentralitätsmaße in Netzwerken mit einem höheren Durchschnittsgrad oft robuster sind. Die Untersuchung des Einflusses von nicht-zufälligen Fehlern auf die Robustheit legt nahe, dass Zentralitätsmaße oft robuster sind, wenn fehlende Knoten mit zur selben Community gehören. Für die Entwicklung von Imputationsverfahren, die auf Techniken des maschinellen Lernens basieren, wird ein Verfahren zur Evaluierung von Node-Embedding-Verfahren vorgeschlagen. |
Language | English |
Keywords | Network Data; Network Analysis; Netzwerkdaten; Netzwerkanalyse |
Date of defense | 2020-06-03 |
Year of publication in PubData | 2020 |
Publishing type | First publication |
Date issued | 2020-06-23 |
Creation context | Research |
Notes | Das Rahmenpapier der kumulativen Dissertation enthält vier Beiträge. |
Granting Institution | Leuphana Universität Lüneburg |
Published by | Medien- und Informationszentrum, Leuphana Universität Lüneburg |
Files in This Item:
File | Size | Format | |
---|---|---|---|
Diss_2020_Martin_Christoph.pdf License: Nutzung nach Urheberrecht open-access | 2 MB | Adobe PDF | View/Open |
Items in PubData are protected by copyright, with all rights reserved, unless otherwise indicated.
Views
Item Export Bar
Access statistics
Page view(s): 94
Download(s): 16