KI im Test: Klausuraufgaben lösen

Kann KI Studenten durch Prüfungen bringen?

Ab Ende 2022 war ChatGPT von der US-amerikanischen Fa. Open AI auch in Deutschland im Internet verfügbar. Selbstverständlich ging der damit ausgelöste Hype um Künstliche Intelligenz (engl.: Artificial Intelligence) auch an mir nicht spurlos vorüber. Weil ich seinerzeit noch als Lehrbeauftragter tätig war, interessierte mich zunächst vor allem die Frage, ob KI das Potenzial hat, Studenten durch eine Prüfung zu bringen oder eine Belegarbeit zu erstellen.

Um das herauszufinden, bat ich ChatGPT, einige meiner Klausuraufgaben zum Thema Abwasser im Masterstudiengang Urbane Infrastrukturplanung - Verkehr und Wasser, Modul Entsorgung an der Berliner Hochschule für Technik zu lösen. Allerdings ließ ich dabei Aufgaben außen vor, die eine Berechnung erforderten.

Nachfolgend das Frage- und Antwort-Spiel mit ChatGPT, geführt am 2. März 2023.

Frage 1 (3 Punkte)

Die Aufenthaltszeit des Abwassers in der Belebungsstufe kommunaler Kläranlagen liegt in Deutschland im Mittel bei etwa 8 Stunden. Damit können die behördlichen Vorgaben zur Eliminierung organischer Abwasserinhaltsstoffe gemessen am CSB in aller Regel eingehalten und unterschritten werden. In Klärwerken für Abwasser mit hohen Anteilen schwer abbaubarer Inhaltsstoffe (z.B. in der Chemieindustrie) muss hingegen mit deutlich längeren Aufenthaltszeiten (24 … 48 h) gearbeitet werden, oft müssen auch zwei oder mehr biologische Behandlungsstufen hintereinander geschaltet werden, um die behördlich festgelegten CSB-Ablaufwerte einzuhalten.

Warum?

Berücksichtigen Sie bei Ihrer Antwort die Theorie des CSB-Abbaus in Belebungsanlagen!

Screenshot der Antwort von ChatGPT auf Frage 1:

Screenshot der Antwort von ChatGPT auf Frage 1


ChatGPT erklärte korrekt, dass schwer abbaubare Inhaltsstoffe längere biologische Abbauprozesse benötigen und die Mikroorganismen mehr Zeit brauchen, um diese Substanzen zu metabolisieren. Die Antwort berücksichtigte die Kinetik des CSB-Abbaus und die Notwendigkeit mehrstufiger Behandlungssysteme.

Punktzahl: 3 von 3

Frage 2 (2 Punkte)

Warum ist man von der nachgeschalteten Denitrifikation auch im internationalen Maßstab wieder abgerückt?

Screenshot der Antwort von ChatGPT auf Frage 2:

Screenshot der Antwort von ChatGPT auf Frage 2


ChatGPT nannte die wesentlichen Gründe: höherer Energiebedarf, Notwendigkeit einer externen Kohlenstoffquelle, und die Bevorzugung der vorgeschalteten Denitrifikation als effizientere Alternative.

Punktzahl: 2 von 2

Frage 3 (4 Punkte)

Wozu dient bei der vorgeschalteten Denitrifikation die interne Rezirkulation?

Zeigen Sie anhand der Formel für den maximal möglichen Wirkungsgrad der vorgeschalteten Denitrifikation (vgl. DWA-A 131, S. 49, Formel 53), dass sich eine Erhöhung des Rückführverhältnisses (RF) über einen Faktor von 3 hinaus immer weniger lohnt! Abgesehen vom rechnerischen Ergebnis ist in der Praxis bei über 3 hinausgehenden Werten von RF eine zunehmende Verschlechterung der Denitrifikation zu beobachten. Woran liegt das?

Screenshot der Antwort von ChatGPT auf Frage 3:

Screenshot der Antwort von ChatGPT auf Frage 3


ChatGPT erklärte die Funktion der internen Rezirkulation korrekt und zeigte mathematisch, warum RF-Werte über 3 wenig zusätzlichen Nutzen bringen. Die Begründung für das Einbrechen der Denitrifikation bei übermäßig hohen Rückführverhältnissen war falsch, nicht Kohlenstoffmangel sondern das Vorhandensein gelösten Sauerstoffs ist die Ursache.

Kommentar: Fast alles richtig, Ausnahme: nicht Kohlenstoff, sondern ein zu hoher Gehalt an gelöstem Sauerstoff stört die Denitrifikation, wenn das Rückführverhältnis den optimalen Wert übersteigt!

Punktzahl: 3 von 4

(1 Punkt Abzug, weil nicht Kohlenstoff, sondern ein zu hoher Gehalt an gelöstem Sauerstoff die Denitrifikation stört)

Frage 4 (4 Punkte)

Beim Anspringen einer Mischwasserentlastung infolge von Regen wird immer ein Anteil behandlungsbedürftiges Schmutzwasser in das aufnehmende Gewässer verfrachtet. Warum sind derartige Einleitungen deutlich kritischer einzustufen als der gereinigte Ablauf aus Klärwerken?

Screenshot der Antwort von ChatGPT auf Frage 4:

Screenshot der Antwort von ChatGPT auf Frage 4


ChatGPT nannte alle wesentlichen Punkte: höhere Schadstoffkonzentrationen, Stoßbelastung, fehlende Behandlung, Sauerstoffzehrung und ökologische Auswirkungen.

Punktzahl: 4 von 4

Frage 5 (5 Punkte)

Beschreiben Sie das Zusammenspiel von Drossel und Regenüberlaufbecken im Zulauf einer Kläranlage, (RÜB angeordnet im Nebenschluss)!

Wie sind die Fließwege des Mischabwassers im Regenwetterfall, wenn

  • a) das Regenüberlaufbecken noch über ausreichend Speichervolumen verfügt bzw.
  • b) das Speichervolumen im Regenüberlaufbecken erschöpft ist.

Fertigen Sie eine Skizze der jeweiligen Fließwege an und geben Sie eine kurze verbale Erläuterung dieser Szenarien!

Screenshot der Antwort von ChatGPT auf Frage 5:

Screenshot der Antwort von ChatGPT auf Frage 5


ChatGPT lieferte eine unzureichende Antwort, die den Zweck des Zusammenwirkens von Drossel und RÜB völlig missdeutet.

Kommentar: ChatGPT erkennt nicht das Zusammenwirken von Drossel und Regenüberlaufbecken im Zulauf der Kläranlage. Die Funktion der Drossel wird vollständig ignoriert, so dass in Szenario b) sogar ein Überschreiten der hydraulischen Kapazität der Kläranlage halluziniert wird.

Tatsächlich sorgt die Drossel aber dafür, dass der Abwasservolumenstrom auf den Wert begrenzt wird, der von der Kläranlage hydraulisch maximal aufgenommen werden kann. Alles, was darüber hinaus geht, wird in das Regenüberlaufbecken (RÜB) geleitet. Fällt der Zulauf zur Kläranlage wieder auf den Volumenstrom bei Trockenwetter, wird das Abwasser aus dem RÜB - nach Maßgabe der freien Kapazität - zur Kläranlage geschickt und dort behandelt. Ist das RÜB aber voll, wenn die Drossel weiterhin Abwasser zum RÜB leitet, muss ins Gewässer abgeschlagen werden.

Screenshot der Antwort von ChatGPT auf Frage 5
Punktzahl: 1 von 5

Fazit und Vergleich

ChatGPT (März 2023)

13/18
Note 2,7
Prädikat: befriedigend

72% der erreichbaren Punktzahl

Manus AI (Oktober 2025)

16/18
Note 1,7
Prädikat: gut

89% der erreichbaren Punktzahl

Zusammenfassung

Die meisten Fragen wurden von ChatGPT völlig korrekt beantwortet. Lediglich bei der Frage zum Zusammenspiel von Drossel und Regenüberlaufbecken im Zulauf einer Kläranlage schwächelte die KI.

Die gleichen Fragen stellte ich am 13. Oktober 2025 auch Manus AI. Das Ergebnis zeigt eine deutliche Verbesserung der KI-Leistung innerhalb von zweieinhalb Jahren.

Das Frage- und Antwort-Spiel mit Manus ist hier dokumentiert:
→ Zum Manus-Dialog