← Zurück zur Übersicht
Master-Projekt2026

Zero Waste@FFM - Bioabfall-Analyse

Data Engineering & Machine Learning zur Vorhersage von Bioabfall-Trennverhalten in Frankfurt

Zero Waste@FFM - Bioabfall-Analyse

Überblick

Im Rahmen meines Master-Studiums der Wirtschaftsinformatik entwickelten wir ein umfassendes Data Science Projekt zur Analyse und Vorhersage des Bioabfall-Trennverhaltens in Frankfurt am Main. Das Projekt kombinierte Data Engineering und Data Mining, um der Frankfurter Entsorgungs- und Service GmbH (FES) dabei zu helfen, die Qualität der Mülltrennung zu verbessern und Verunreinigungen in der Biotonne zu reduzieren.

Die Herausforderung

Frankfurt steht vor einem massiven Problem: Jährlich werden rund 62.000 Tonnen wertvolle Biomasse verschwendet, weil sie durch Verunreinigungen nicht optimal verwertet werden können. Ein erheblicher Anteil an Fehlwürfen (Störstoffe wie Kunststoffe) landet in der Biotonne, was die Verarbeitung in Behandlungsanlagen massiv erschwert und zu erheblichen Mehrkosten führt. Besonders kritisch: Fehlwürfe können dazu führen, dass Mikroplastik über den Kompost direkt in die Böden gelangt.

Projektziele

  • Aufbau einer belastbaren Datenbasis zur Analyse des Bioabfall-Trennverhaltens
  • Identifikation von Haushalten mit schlechtem Trennverhalten
  • Entwicklung prädiktiver Modelle zur Vorhersage von Fehlwürfen
  • Datenbasierte Grundlage für gezielte Aufklärungsmaßnahmen
  • Unterstützung der FES bei der Optimierung der Müllentsorgung

Data Engineering Phase

Die erste Phase des Projekts fokussierte sich auf Business Understanding, Data Understanding und Data Preparation nach der CRISP-DM Methodik.

Datenquellen

  • SmartScan & DeepScan: Sensorsysteme auf Müllwagen zur Erfassung von Leerungen
  • Post Direkt: Adress- und Marktdaten von Frankfurter Haushalten
  • OpenStreetMap: Geodaten für räumliche Analysen
  • FES-Entsorgungsdaten: Historische Leerungs- und Entsorgungsinformationen
  • Kommunale Daten: Frankfurts Geo- und Datenportal

Data Preparation

  • Bereinigung und Strukturierung der Sensordaten (SmartScan, DeepScan)
  • Handling von Missing Values und Ausreißern
  • Frankfurter Hauskoordinaten-Mapping
  • Joining verschiedener Datenquellen (Post Direkt, Geodaten, FES-Daten)
  • Feature Engineering für geografische und demographische Merkmale
  • Kreisdiagramm-Analyse nach Merging der Datensätze

Data Mining & Modeling Phase

In der zweiten Phase entwickelten wir Machine Learning Modelle zur Klassifikation und Vorhersage des Trennverhaltens.

Feature Engineering

  • Generierung relevanter Features aus den bereinigten Daten
  • Feature Selection zur Identifikation der wichtigsten Prädiktoren
  • Zeitliche und räumliche Aggregationen
  • Demographische und geografische Features

Modeling mit AutoML

  • KNIME als zentrale Plattform für AutoML
  • Verschiedene Klassifikationsmodelle im Vergleich
  • XGBoost Tree Ensemble als bestes Modell
  • Regression und Classification Ansätze
  • Hyperparameter-Tuning für optimale Performance

Evaluation

  • Detaillierte Confusion Matrix Analyse
  • ROC-Kurven und Performance-Metriken (Accuracy, Precision, Recall)
  • RMSE für Regressionsmodelle
  • Global Feature Importance zur Interpretation
  • Vergleich verschiedener Modellansätze

Ergebnisse

Das Projekt lieferte der FES eine datenbasierte Grundlage zur Identifikation von problematischen Haushalten und ermöglichte gezielte Maßnahmen zur Verbesserung der Mülltrennung.

  • Erfolgreiche Vorhersage von Haushalten mit schlechtem Trennverhalten
  • Identifikation der wichtigsten Einflussfaktoren (Feature Importance)
  • Belastbare Datenbasis für zukünftige Analysen
  • Decision Trees zur interpretierbaren Klassifikation
  • Grundlage für gezielte Aufklärungskampagnen der FES und Stadt Frankfurt

Technische Implementation

Tools & Frameworks

  • KNIME für Data Engineering und AutoML
  • Python für Datenverarbeitung und Analysen
  • OpenStreetMap API für Geodaten
  • CRISP-DM als Projektmethodik

Machine Learning

  • AutoML für automatisiertes Model Selection
  • XGBoost Tree Ensemble als finales Modell
  • Decision Trees für interpretierbare Ergebnisse
  • Feature Importance Analysis
  • Cross-Validation für robuste Evaluation

Impact

Das Projekt demonstriert, wie Data Science konkret zur Lösung gesellschaftlicher und ökologischer Probleme beitragen kann. Durch die Identifikation von Haushalten mit schlechtem Trennverhalten kann die FES gezielte Aufklärungsmaßnahmen durchführen und so die Qualität der Bioabfall-Verwertung verbessern - mit direktem positivem Einfluss auf Umwelt und Ressourcenkreislauf in Frankfurt.

Verwendete Technologien

KNIMEPythonAutoMLXGBoostOpenStreetMapCRISP-DMData Engineering