Please use this identifier to cite or link to this item: https://doi.org/10.48548/pubdata-771
Resource typeBachelor Thesis
Title(s)Inhaltsanalytische Untersuchung zum Thema Nachhaltigkeit mit RapidMiner
Alternative title(s)Content analytical survey on the subject of sustainability with RapidMiner
DOI10.48548/pubdata-771
Handle20.500.14123/809
CreatorSchöbel, Theresa
RefereeWilk, Jan
Barbian, Guido
AbstractDue to the continuously growing amount of data, data analysis becomes more and more important. Especially the analysis of text documents without manual support helps significally to extract the relevant information. Besides different possibilities to determine text documents, rules and patterns can be detected or categories can be assigned to language information. This kind of investigations is part of text mining and the present study is about to recreate a qualitative content analysis on the subject of sustainability. The aim is to prove how close automatic procedures can reach the results of a consisting research. The implementation contains four different processes, made with the open source software RapidMiner, that analyse the content of newspaper articles. An association analysis as well as a classification can be done to explore the context and use of the term of sustainability in public media. The present study finds out whether automatic methods or manual techniques can provide sufficient outcomes by comparing these results with those on the basis of a study by Fischer and Haucke. The findings show that it is possible to realize a content analysis with RapidMiner and to reduce the amount of time needed with conventional methods - but they also show that the results decline with the effort being diminished. Therefore text mining methods cannot be used on themselves to analyse specific contexts so far.

Auf Grund der stetig wachsenden Menge an Daten gewinnt die automatische Datenanalyse durch Algorithmen zunehmend an Bedeutung. Im Speziellen trägt die Analyse von Texten ohne manuelles Zutun zu einer erheblichen Erleichterung der Extraktion von relevanten Informationen bei. Sprachliche Informationen können neben der Zuordnung zu Kategorien auf Regeln und Muster untersucht werden. Diese Art der Untersuchung fällt in den Bereich des Text Minings, und in der vorliegenden Arbeit geht es darum, eine qualitative Inhaltsanalyse zum Thema Nachhaltigkeit nachzuempfinden. Es soll geprüft werden, in wie weit automatisierte Verfahren in der Lage sind, Ergebnisse einer bereits bestehenden Untersuchung zu erzielen. In der Durchführung werden mit der Open Source-Software RapidMiner vier Prozesse erstellt, die darauf abzielen, Zeitungsartikel auf ihren Inhalt zu analysieren. Unter anderem werden eine Assoziationsanalyse und eine Klassifikation realisiert, deren Ziel es ist, den Kontext und die Verwendung des Begriffes der Nachhaltigkeit in den Medien zu untersuchen. Die vorliegende Studie will prüfen, ob automatisierten Methoden im Vergleich zu manuellen Verfahren hinreichende Ergebnisse liefern können, sodass die hiesigen Resultate an denen der zu Grunde gelegten Studie von Fischer und Haucke gemessen werden sollen. Die Ergebnisse zeigen, dass die Realisierung einer Inhaltsanalyse mit RapidMiner möglich ist und zu erheblichen Zeiteinsparungen gegenüber konventionellen Verfahren führt. Sie zeigen jedoch auch, dass sich die Minderung des Aufwandes in der Ergebnisqualität widerspiegelt und somit der alleinige Einsatz von Text Mining Verfahren zur Analyse von spezifischen Kontexten noch nicht ausreichend ist.
LanguageGerman
KeywordsData Analysis; Sustainability; Data Mining; Text Mining; Datenanalyse; Nachhaltigkeit; Data Mining; Text Mining
Year of publication in PubData2016
Publishing typeFirst publication
Date issued2016-02-18
Creation contextStudy
Granting InstitutionLeuphana Universität Lüneburg
Published byMedien- und Informationszentrum, Leuphana Universität Lüneburg
Files in This Item:
File SizeFormat 

Vfinal_BA_Veroeffentlichung.pdf
MD5: 4983f7c2663ba1b36bed24c44f29adce
License:  Nutzung nach Urheberrecht
open-access

1.01 MB

Adobe PDF
View/Open

Items in PubData are protected by copyright, with all rights reserved, unless otherwise indicated.

Citation formats
Access statistics

Page view(s): 24

Download(s): 19