Master-Projekt2026

Zero Waste@FFM - Bioabfall-Analyse

Data Engineering & Machine Learning zur Vorhersage von Bioabfall-Trennverhalten in Frankfurt

Überblick

Im Rahmen meines Master-Studiums der Wirtschaftsinformatik entwickelten wir ein umfassendes Data Science Projekt zur Analyse und Vorhersage des Bioabfall-Trennverhaltens in Frankfurt am Main. Das Projekt kombinierte Data Engineering und Data Mining, um der Frankfurter Entsorgungs- und Service GmbH (FES) dabei zu helfen, die Qualität der Mülltrennung zu verbessern und Verunreinigungen in der Biotonne zu reduzieren.

Die Herausforderung

Frankfurt steht vor einem massiven Problem: Jährlich werden rund 62.000 Tonnen wertvolle Biomasse verschwendet, weil sie durch Verunreinigungen nicht optimal verwertet werden können. Ein erheblicher Anteil an Fehlwürfen (Störstoffe wie Kunststoffe) landet in der Biotonne, was die Verarbeitung in Behandlungsanlagen massiv erschwert und zu erheblichen Mehrkosten führt. Besonders kritisch: Fehlwürfe können dazu führen, dass Mikroplastik über den Kompost direkt in die Böden gelangt.

Projektziele

Aufbau einer belastbaren Datenbasis zur Analyse des Bioabfall-Trennverhaltens
Identifikation von Haushalten mit schlechtem Trennverhalten
Entwicklung prädiktiver Modelle zur Vorhersage von Fehlwürfen
Datenbasierte Grundlage für gezielte Aufklärungsmaßnahmen
Unterstützung der FES bei der Optimierung der Müllentsorgung

Data Engineering Phase

Die erste Phase des Projekts fokussierte sich auf Business Understanding, Data Understanding und Data Preparation nach der CRISP-DM Methodik.

Datenquellen

SmartScan & DeepScan: Sensorsysteme auf Müllwagen zur Erfassung von Leerungen
Post Direkt: Adress- und Marktdaten von Frankfurter Haushalten
OpenStreetMap: Geodaten für räumliche Analysen
FES-Entsorgungsdaten: Historische Leerungs- und Entsorgungsinformationen
Kommunale Daten: Frankfurts Geo- und Datenportal

Data Preparation

Bereinigung und Strukturierung der Sensordaten (SmartScan, DeepScan)
Handling von Missing Values und Ausreißern
Frankfurter Hauskoordinaten-Mapping
Joining verschiedener Datenquellen (Post Direkt, Geodaten, FES-Daten)
Feature Engineering für geografische und demographische Merkmale
Kreisdiagramm-Analyse nach Merging der Datensätze

Data Mining & Modeling Phase

In der zweiten Phase entwickelten wir Machine Learning Modelle zur Klassifikation und Vorhersage des Trennverhaltens.

Feature Engineering

Generierung relevanter Features aus den bereinigten Daten
Feature Selection zur Identifikation der wichtigsten Prädiktoren
Zeitliche und räumliche Aggregationen
Demographische und geografische Features

Modeling mit AutoML

KNIME als zentrale Plattform für AutoML
Verschiedene Klassifikationsmodelle im Vergleich
XGBoost Tree Ensemble als bestes Modell
Regression und Classification Ansätze
Hyperparameter-Tuning für optimale Performance

Evaluation

Detaillierte Confusion Matrix Analyse
ROC-Kurven und Performance-Metriken (Accuracy, Precision, Recall)
RMSE für Regressionsmodelle
Global Feature Importance zur Interpretation
Vergleich verschiedener Modellansätze

Ergebnisse

Das Projekt lieferte der FES eine datenbasierte Grundlage zur Identifikation von problematischen Haushalten und ermöglichte gezielte Maßnahmen zur Verbesserung der Mülltrennung.

Erfolgreiche Vorhersage von Haushalten mit schlechtem Trennverhalten
Identifikation der wichtigsten Einflussfaktoren (Feature Importance)
Belastbare Datenbasis für zukünftige Analysen
Decision Trees zur interpretierbaren Klassifikation
Grundlage für gezielte Aufklärungskampagnen der FES und Stadt Frankfurt

Technische Implementation

Tools & Frameworks

KNIME für Data Engineering und AutoML
Python für Datenverarbeitung und Analysen
OpenStreetMap API für Geodaten
CRISP-DM als Projektmethodik

Machine Learning

AutoML für automatisiertes Model Selection
XGBoost Tree Ensemble als finales Modell
Decision Trees für interpretierbare Ergebnisse
Feature Importance Analysis
Cross-Validation für robuste Evaluation

Impact

Das Projekt demonstriert, wie Data Science konkret zur Lösung gesellschaftlicher und ökologischer Probleme beitragen kann. Durch die Identifikation von Haushalten mit schlechtem Trennverhalten kann die FES gezielte Aufklärungsmaßnahmen durchführen und so die Qualität der Bioabfall-Verwertung verbessern - mit direktem positivem Einfluss auf Umwelt und Ressourcenkreislauf in Frankfurt.

Verwendete Technologien

KNIMEPythonAutoMLXGBoostOpenStreetMapCRISP-DMData Engineering