Please use this identifier to cite or link to this item: https://doi.org/10.48548/pubdata-517
Resource typeDissertation
Title(s)Mining of LC-HRMS data for the assessment of water treatment processes
Alternative title(s)Data-Mining von LC-HRMS-Daten zur Bewertung von Wasseraufbereitungsprozessen
DOI10.48548/pubdata-517
Handle20.500.14123/552
CreatorBader, Tobias
RefereeKümmerer, Klaus  0000-0003-2027-6488  118066382
Zwiener, Christian  139160884
Tümpling, Wolf von  1056723823
AdvisorKümmerer, Klaus  0000-0003-2027-6488  118066382
AbstractThe emission of anthropogenic trace substances into the aquatic environment continuously poses challenges to water suppliers. The contamination of raw waters with organic trace substances requires complex water treatment processes to secure drinking water quality. The routine monitoring of these raw waters as well as the behavior and fate of organic trace substances during different treatment processes is of great interest to recognize and counter potential dangers at an early stage. Non-target screening using liquid chromatography coupled to high-resolution mass spectrometry (LC-HRMS) allows the detection of thousands of compounds within a single run and covers known as well as unknown substances. Compared to the established analytical techniques, this is a decisive advantage for the monitoring of raw and process waters during water treatment. While the analytical technique LC-HRMS has undergone significant developments in recent years, the algorithms for data processing reveal clear weaknesses. This dissertation therefore deals with reliable processing strategies for LC-HRMS data. The first part of this work seeks to highlight the problematics of false positive and false negative findings. Based on repeated measurements, various strategies of data processing were assessed with regard to the repeatability of the results. To ensure that real peaks were barely or not removed by the filtering procedure, samples were spiked with isotope-labeled standards. The results emphasize that the processing of sample triplicates results in sufficient repeatability and that the signal fluctuation across the triplicates emerged as a powerful filtering criteria. The number of false positives and false negatives could be significantly reduced by the developed strategies which consequently improve the validity of the data. The second part of this thesis addresses the development of processing strategies particularly aimed at assessing water treatment processes. The detected signals were tracked across the treatment process and classified based on their fold changes. A more reliable signal classification was achieved by implementing a recursive integration approach. Special integration algorithms allow a reliable signal classification even though the signal to be compared was below the intensity threshold. Different combinations of replicates of process influents and effluents were processed for evaluating the repeatability. The good repeatability was indicated by the results of both the plausibility checks and the ozonation process (ozonation of pretreated river water) and thus points to high reliability. The applicability of the developed strategies to real world applications is demonstrated in the last part of this work. Besides the prioritization of the generated results, the main focus was the identification of recognized compounds. The developed strategies clearly improve the validity of the underlying data. The combination of LC-HRMS analysis with reliable processing strategies opens up multiple possibilities for a more comprehensive monitoring of water resources and for the assessment of water treatment processes. The processing strategies and validation concepts may be easily transferred to other research fields.

Die Emission von anthropogenen Spurenstoffen in die aquatische Umwelt stellt Wasserversorger fortwährend vor neue Herausforderungen. Mit organischen Spurenstoffen belastete Rohwässer erfordern komplexe Aufbereitungsverfahren zur Sicherung der Trinkwasserqualität. Sowohl die routinemäßige Überwachung dieser Rohwässer als auch das Verhalten organischer Spurenstoffe während verschiedener Aufbereitungsprozesse ist von großem Interesse, um etwaige Gefahren frühzeitig zu erkennen. Mit sogenannten "non-target screening"-Methoden lassen sich tausende Verbindungen in einer Analyse erfassen. Durch die Kopplung von Flüssigkeitschromatographie mit hochauflösender Massenspektrometrie (LC-HRMS) können neben bekannten auch unbekannte Spurenstoffe detektiert werden. In Hinblick auf die Überwachung von Roh- und Prozesswässern bei der Wasseraufbereitung stellt dies einen entscheidenden Vorteil gegenüber etablierten analytischen Techniken dar. Während die LC-HRMS-Analytik in den letzten Jahren stark weiterentwickelt wurde, zeigen die Auswertealgorithmen jedoch noch deutliche Schwachstellen. Die vorliegende Doktorarbeit befasst sich daher mit Strategien zur verlässlichen Auswertung von LC-HRMS-Daten. Im ersten Schritt wurde die Problematik von falsch-positiv- und falsch-negativ-Befunden beleuchtet. Basierend auf Wiederholmessungen wurden verschiedene Strategien der Datenauswertung hinsichtlich der Ergebniswiederholbarkeit bewertet. Durch das Dotieren isotopenmarkierter Standards wurde sichergestellt, dass echte Signale durch die Datenfilterung nicht entfernt werden. Die Daten zeigen, dass Probentriplikate hinreichend gute Ergebnisse liefern und die Berücksichtigung der Signalschwankungen über Replikatmessungen eine sehr effiziente Filtermethode darstellt. Durch die entwickelten Vorgehensweisen konnte die Anzahl von falsch-positiv- und falsch-negativ-Befunden bei der Datenauswertung signifikant reduziert und die Validität der Daten gesteigert werden. Im zweiten Teil der Arbeit wurden Auswertestrategien speziell zur Bewertung von Wasseraufbereitungsprozessen entwickelt. Die detektierten Signale wurden während des Behandlungsprozesses verfolgt und einer Signalklassifikation unterzogen. Durch die Implementierung eines rekursiven Ansatzes unter Verwendung spezieller Integrationsalgorithmen konnte eine deutlich verlässlichere Signalklassifikation vorgenommen werden, auch wenn zu vergleichende Signale unterhalb des festgelegten Intensitätsschwellenwertes lagen. Zur Bewertung der Wiederholbarkeit wurden verschiedene Kombinationen von Replikaten aus Prozesszuläufen und -abläufen ausgewertet. Sowohl die Ergebnisse der Plausibilitätskontrollen als auch die des realen Prozesses einer Ozonung von vorgereinigtem Flusswasser zeigten eine gute Wiederholbarkeit und lassen demnach auf eine hohe Reliabilität schließen. Im letzten Teil der Arbeit wurde die Anwendbarkeit der entwickelten Strategien in der Realität verdeutlicht. Neben der Priorisierung von Ergebnissen wurde ein Hauptaugenmerk auf die Identifikation erfasster Komponenten gelegt. Die in dieser Arbeit erarbeiteten Strategien tragen deutlich zur Steigerung der Datenvalidität bei. Die Kombination der LC-HRMS-Analytik mit verlässlichen Auswertestrategien eröffnet eine Vielzahl an Möglichkeiten zur umfassenderen Überwachung von Wasserressourcen und zur Beschreibung von Aufbereitungsprozessen. Die entwickelten Strategien und Validierungskonzepte lassen sich auf andere Forschungsgebiete übertragen.
LanguageEnglish
KeywordsData Mining; Data Mining
Date of defense2018-05-17
Year of publication in PubData2018
Publishing typeFirst publication
Date issued2018-06-05
Creation contextResearch
Granting InstitutionLeuphana Universität Lüneburg
Published byMedien- und Informationszentrum, Leuphana Universität Lüneburg
Files in This Item:
File SizeFormat 

1_Dissertation_Bader.pdf
MD5: 1d6a7fc4f8567d7b992c8a345191db83
License:  Nutzung nach Urheberrecht
open-access

5.41 MB

Adobe PDF
View/Open

Items in PubData are protected by copyright, with all rights reserved, unless otherwise indicated.

Citation formats
Access statistics

Page view(s): 7

Download(s): 9