Dataset Handle: 20.500.14123/239

QSBR models for ionic liquids based on OECD 301D data, 2023, V1

Archiving without access
No downloads available

Chronological data

Date of availability in catalog2024-04-23
Available from / since 2024-04-23

Language of the resource

English

Related PubData resources

Derived from

Resource
Dataset
Amsel, Ann-Kathrin; Olsson, Oliver; Kümmerer, Klaus
Resource
Dataset
Amsel, Ann-Kathrin; Kümmerer, Klaus; Olsson, Oliver

Abstract

Es wurden fünf fragmentbasierte QSBR Modelle (Quantitative structure-biodegradability-relationship) für ionische Flüssigkeiten in der MultiCASE FlexFilters Plattform auf Basis von OECD 301D-Daten entwickelt. Zwei Datensätze, set_IL und set_ILNI, wurden erstellt. Diese unterscheiden sich darin, dass set_IL ausschließlich ionische Flüssigkeiten (Ils) enthielt, während set_ILNI zusätzlich zu den ionischen Flüssigkeiten organische Anionen in Kombination mit anorganischen Kationen und nicht-ionische Substanzen enthielt. Außerdem enthielt set_IL Stereoisomere für die ionischen Flüssigkeiten, die am Institut für Nachhaltige Chemie (INSC) der Leuphana Universität Lüneburg getestet wurden. Diese wurden in set_ILNI zu einer ionischen Flüssigkeit zusammengefasst. Set_IL und set_ILNI wurden in einen Trainingssatz mit 233 bzw. 321 Substanzen und einen Testsatz mit 26 bzw. 36 Substanzen unterteilt. Das Regressionsverfahren der kleinsten Quadrate (engl. ordinary least squares, OLS) wurde verwendet, um Modelle zu bauen, die einen kontinuierlichen Bioabbauwert vorhersagen. Logistische Regression (engl. logistic regression, LR) wurde für Modelle, die eine Klassifizierung in bioabbaubar/nicht bioabbaubar vornehmen, angewendet. Als Deskriptoren wurden einerseits Strukturfragmente auf Basis von Extended-Connectivity Fingerprints (ECFP) und andererseits Elemente des von Chakravarti (2018) entwickelten Fingerabdrucks (Distrib_FP_600) verwendet. Die für den Bioabbau relevanten Fragmenten, die als Deskriptoren dienten, wurden anhand der L1 Regularisierung ausgewählt. Die Strukturfragmente auf Basis der ECFP werden in den Modellen als Alert angegeben. Die fünf Modelle unterscheiden sich im Trainingsdatensatz, den Deskriptoren und dem Regressionsverfahren. Eine interne und externe Validierung wurde durchgeführt. Die Daten zeigen die verwendeten Deskriptoren, die zugehörigen Regressionskoeffizienten und die Validierung.

Resource type

Dataset

Kinds of Data

Models / Modellings

Methods

Modeling

Thematic classification

Green Chemistry

Keywords

Biologische Abbaubarkeit; Nachhaltige Chemie; Ionische Flüssigkeiten; Grüne Chemie; Modellierung; Biodegradability; Sustainable Chemistry; Ionic Liquids; Green Chemistry; Modeling

More information

Time Period of the Collection of the Data

Time Period of the Creation of the Dataset

2020 - 2022

Temporal Coverage of the Dataset

Geolocation (Country)

Geolocation (Region/Location)