Zero Waste@FFM - Bioabfall-Analyse
Data Engineering & Machine Learning zur Vorhersage von Bioabfall-Trennverhalten in Frankfurt

Überblick
Im Rahmen meines Master-Studiums der Wirtschaftsinformatik entwickelten wir ein umfassendes Data Science Projekt zur Analyse und Vorhersage des Bioabfall-Trennverhaltens in Frankfurt am Main. Das Projekt kombinierte Data Engineering und Data Mining, um der Frankfurter Entsorgungs- und Service GmbH (FES) dabei zu helfen, die Qualität der Mülltrennung zu verbessern und Verunreinigungen in der Biotonne zu reduzieren.
Die Herausforderung
Frankfurt steht vor einem massiven Problem: Jährlich werden rund 62.000 Tonnen wertvolle Biomasse verschwendet, weil sie durch Verunreinigungen nicht optimal verwertet werden können. Ein erheblicher Anteil an Fehlwürfen (Störstoffe wie Kunststoffe) landet in der Biotonne, was die Verarbeitung in Behandlungsanlagen massiv erschwert und zu erheblichen Mehrkosten führt. Besonders kritisch: Fehlwürfe können dazu führen, dass Mikroplastik über den Kompost direkt in die Böden gelangt.
Projektziele
- Aufbau einer belastbaren Datenbasis zur Analyse des Bioabfall-Trennverhaltens
- Identifikation von Haushalten mit schlechtem Trennverhalten
- Entwicklung prädiktiver Modelle zur Vorhersage von Fehlwürfen
- Datenbasierte Grundlage für gezielte Aufklärungsmaßnahmen
- Unterstützung der FES bei der Optimierung der Müllentsorgung
Data Engineering Phase
Die erste Phase des Projekts fokussierte sich auf Business Understanding, Data Understanding und Data Preparation nach der CRISP-DM Methodik.
Datenquellen
- SmartScan & DeepScan: Sensorsysteme auf Müllwagen zur Erfassung von Leerungen
- Post Direkt: Adress- und Marktdaten von Frankfurter Haushalten
- OpenStreetMap: Geodaten für räumliche Analysen
- FES-Entsorgungsdaten: Historische Leerungs- und Entsorgungsinformationen
- Kommunale Daten: Frankfurts Geo- und Datenportal
Data Preparation
- Bereinigung und Strukturierung der Sensordaten (SmartScan, DeepScan)
- Handling von Missing Values und Ausreißern
- Frankfurter Hauskoordinaten-Mapping
- Joining verschiedener Datenquellen (Post Direkt, Geodaten, FES-Daten)
- Feature Engineering für geografische und demographische Merkmale
- Kreisdiagramm-Analyse nach Merging der Datensätze
Data Mining & Modeling Phase
In der zweiten Phase entwickelten wir Machine Learning Modelle zur Klassifikation und Vorhersage des Trennverhaltens.
Feature Engineering
- Generierung relevanter Features aus den bereinigten Daten
- Feature Selection zur Identifikation der wichtigsten Prädiktoren
- Zeitliche und räumliche Aggregationen
- Demographische und geografische Features
Modeling mit AutoML
- KNIME als zentrale Plattform für AutoML
- Verschiedene Klassifikationsmodelle im Vergleich
- XGBoost Tree Ensemble als bestes Modell
- Regression und Classification Ansätze
- Hyperparameter-Tuning für optimale Performance
Evaluation
- Detaillierte Confusion Matrix Analyse
- ROC-Kurven und Performance-Metriken (Accuracy, Precision, Recall)
- RMSE für Regressionsmodelle
- Global Feature Importance zur Interpretation
- Vergleich verschiedener Modellansätze
Ergebnisse
Das Projekt lieferte der FES eine datenbasierte Grundlage zur Identifikation von problematischen Haushalten und ermöglichte gezielte Maßnahmen zur Verbesserung der Mülltrennung.
- Erfolgreiche Vorhersage von Haushalten mit schlechtem Trennverhalten
- Identifikation der wichtigsten Einflussfaktoren (Feature Importance)
- Belastbare Datenbasis für zukünftige Analysen
- Decision Trees zur interpretierbaren Klassifikation
- Grundlage für gezielte Aufklärungskampagnen der FES und Stadt Frankfurt
Technische Implementation
Tools & Frameworks
- KNIME für Data Engineering und AutoML
- Python für Datenverarbeitung und Analysen
- OpenStreetMap API für Geodaten
- CRISP-DM als Projektmethodik
Machine Learning
- AutoML für automatisiertes Model Selection
- XGBoost Tree Ensemble als finales Modell
- Decision Trees für interpretierbare Ergebnisse
- Feature Importance Analysis
- Cross-Validation für robuste Evaluation
Impact
Das Projekt demonstriert, wie Data Science konkret zur Lösung gesellschaftlicher und ökologischer Probleme beitragen kann. Durch die Identifikation von Haushalten mit schlechtem Trennverhalten kann die FES gezielte Aufklärungsmaßnahmen durchführen und so die Qualität der Bioabfall-Verwertung verbessern - mit direktem positivem Einfluss auf Umwelt und Ressourcenkreislauf in Frankfurt.