Blog

Prüfungen im KI-Zeitalter: Wie Hochschulen ihre Formate neu denken

Plagiat Scanner.de Redaktion | 30. März 2026

Fast alle Studierenden nutzen heute ChatGPT für die Uni. Das ist kein Geheimnis mehr. Früher gab es oft Rufe nach einem Verbot. Doch heute finden das nur noch wenige sinnvoll. KI ist im studentischen Alltag angekommen.

Für die Hochschulen ist das ein Problem: Wenn Texte per Knopfdruck entstehen, was sagt eine Hausarbeit dann noch aus? Viele Unis denken deshalb um. Nicht die Studierenden sollen sich ändern, sondern die Prüfungen selbst.

Das Ende der klassischen Hausarbeit?

Professoren bemerken oft, dass schriftliche Arbeiten heute perfekt aussehen. Doch im Gespräch können manche Studierende ihre eigenen Texte kaum erklären. Das alte Modell, bei dem eine Hausarbeit echtes Wissen misst, funktioniert so nicht mehr.

KI-Tools schreiben fehlerfrei und gut strukturiert. Sie beantworten viele Fragen oft sogar besser als Menschen. Deshalb fragen sich viele Dozenten: Was wollen wir eigentlich prüfen?

Das NYU-Experiment: Mündliche Prüfung durch KI

Ipeirotis ging einen ungewöhnlichen Weg. Statt schriftliche Prüfungen beizubehalten und auf KI-Detektoren zu hoffen, ersetzte er sie durch sprachbasierte KI-Interviews. Er nutzte ElevenLabs Conversational AI, um 36 Studierende mündlich zu prüfen. Jedes Gespräch dauerte durchschnittlich 25 Minuten. Die KI stellte Detailfragen zu den Abschlussprojekten der Studierenden und zu Fallstudien aus dem Kurs.

Die Kosten überraschten: 15 Dollar für alle 36 Prüfungen, also rund 42 Cent pro Student. Im Vergleich: Menschliche Prüfer hätten nach Standardsätzen etwa 750 Dollar gekostet. Die Bewertung übernahmen drei verschiedene Sprachmodelle (Claude, Gemini und ChatGPT), die unabhängig voneinander die Transkripte bewerteten und sich anschließend gegenseitig überprüften. Nach dieser Konsultation stimmten 60 Prozent der Noten innerhalb eines Punktes überein.

Interessant waren die Reaktionen der Studierenden. 83 Prozent empfanden die KI-Prüfung als stressiger als schriftliche Tests. Gleichzeitig gaben 70 Prozent zu, dass das Format ihr tatsächliches Verständnis besser erfasste. Das Experiment legte auch Schwächen in der Lehre offen: Im Bereich „Experimentation" schnitten die Studierenden mit durchschnittlich 1,94 von 4 Punkten schlecht ab, was Ipeirotis als Signal für methodische Lücken im A/B-Testing-Unterricht wertete.

Das NYU-Experiment ist ein Einzelfall, kein etabliertes Modell. Es hat technische Schwächen, die frühen Versionen des KI-Agenten hatten einen einschüchternden Ton, und das System zeigte bizarre Zufallsverzerrungen bei der Themenauswahl. Aber es illustriert die Richtung, in die sich das Denken versc

Vier neue Wege für Prüfungen

Deutsche Hochschulen suchen nach Lösungen. Die Experten haben vier Formate gefunden, die im KI-Zeitalter gut funktionieren:

Format	Was passiert hier?	Was wird geprüft?	KI-Sicher?
Praxis-Aufgaben	Echte Fälle lösen, statt nur Wissen abzufragen	Anwendung von Wissen	Mittel bis hoch
KI-Aufgaben	KI-Texte analysieren und Fehler finden	Kritisches Denken	Hoch
Kombi-Prüfung	Text schreiben und danach mündlich erklären	Echtes Verständnis	Hoch
Lerntagebuch	Den Weg zur fertigen Arbeit dokumentieren	Eigenleistung	Sehr hoch

Alle diese Formate haben eines gemeinsam: Es zählt nicht nur das fertige Blatt Papier. Der Weg zum Ziel und das persönliche Verständnis sind viel wichtiger geworden.

ann, weil sie persönliche Reflexion, Kontextwissen oder spontane Argumentation erfordern.

TU Darmstadt: Ein Entscheidungsmodell für Lehrende

Die TU Darmstadt hat einen besonders pragmatischen Ansatz entwickelt. Statt pauschale Vorgaben zu machen, stellt sie Lehrenden ein Entscheidungsmodell zur Verfügung: Soll KI in dieser Prüfung verboten, integriert oder erlaubt werden? Die Antwort hängt davon ab, welche Kompetenzen geprüft werden und ob diese ohne KI beherrscht werden müssen (Quelle: TU Darmstadt, EinfachLehren).

Daraus ergeben sich drei Szenarien:

Erstens: KI-integrierte Aufgaben. Studierende formulieren Prompts, analysieren KI-Ausgaben kritisch, vergleichen verschiedene KI-Tools und überprüfen die Ergebnisse anhand wissenschaftlicher Quellen. Die Bewertungskriterien umfassen „kompetente Prompt-Nutzung, effiziente Methodik, Abgleich mit wissenschaftlichen Quellen und kritische Bewertung der KI-Ergebnisse".

Zweitens: Authentische, komplexe Aufgaben. Echte Fallstudien und Projektarbeiten, die Kontextwissen erfordern, das nicht frei verfügbar ist. Diese Aufgaben sind lösbar, aber komplex genug, dass KI nur Teilaspekte beisteuern kann.

Drittens: Beaufsichtigte Prüfungen. Präsenzklausuren ohne Internetzugang für Kompetenzen, die KI-unabhängig bleiben müssen. Die TU betont dabei, dass Studierende diese Aufgaben auch in Übungen ohne KI-Unterstützung trainieren müssen.

Für unbeaufsichtigte Arbeiten wie Hausarbeiten und Abschlussarbeiten empfiehlt die TU Darmstadt Hybridformate: Die schriftliche Arbeit wird durch eine mündliche Verteidigung ergänzt. So können Lehrende überprüfen, wie tief jemand die Inhalte durchdrungen hat, unabhängig davon, welche Werkzeuge bei der Erstellung zum Einsatz kamen.

Die mündliche Verteidigung gewinnt an Gewicht

Über alle Ansätze hinweg zeichnet sich ein klarer Trend ab: Die mündliche Verteidigung wird vom optionalen Zusatz zum zentralen Prüfungselement. Das Hochschulforum Digitalisierung formuliert es so: „Im Zeitalter der KI gewinnt die mündliche Verteidigung der Arbeit zunehmend an Bedeutung."

Die Logik ist einfach. Eine schriftliche Arbeit lässt sich mit KI-Hilfe erstellen. Eine Verteidigung nicht. Wer seine Arbeit wirklich verstanden hat, kann Fragen beantworten, Zusammenhänge herstellen und Schwächen der eigenen Argumentation einräumen. Wer nur ein KI-generiertes Dokument eingereicht hat, scheitert spätestens bei der dritten Nachfrage.

Die FH Aachen hat konkrete Überlegungen für Abschlussarbeiten formuliert: Bis zu 50 Prozent der Bewertung könnten auf die mündliche Verteidigung entfallen. Dabei werden nicht nur Inhalte abgefragt, sondern auch Reflexionsfähigkeit, methodische Entscheidungen und der Umgang mit Kritik an der eigenen Arbeit (Quelle: FH Aachen, Lehren & Studieren gestalten).

Der Nachteil ist offensichtlich: Mündliche Prüfungen kosten Zeit. Für einen Kurs mit 200 Studierenden bedeuten 25-minütige Einzelgespräche mehr als 80 Stunden Prüfungszeit. Das erfordert personelle Ressourcen, die an vielen Hochschulen knapp sind. Genau deshalb experimentiert Ipeirotis an der NYU mit KI-gestützten mündlichen Prüfungen, bei denen die KI das Gespräch führt und menschliche Prüfer die Auswertung übernehmen.

Portfolios: Den Prozess statt das Produkt bewerten

Das zweite Format, das stark an Bedeutung gewinnt, ist das Prozessportfolio. Statt eine fertige Arbeit abzugeben, dokumentieren Studierende ihren gesamten Lern- und Arbeitsprozess. Dazu gehören Recherche-Notizen, erste Entwürfe, Überarbeitungsschritte, verworfene Ansätze und Reflexionen über die eigenen Entscheidungen.

Ein Portfolio lässt sich nicht sinnvoll von einer KI erstellen lassen. Es verlangt persönliche Reflexion und ein nachvollziehbares Arbeitslog, das zeigt, wie Ideen entstanden und sich entwickelt haben. Die TU Darmstadt bewertet Portfolios explizit nach „Überarbeitungsschritten, Prompt-Entscheidungen und integriertem Feedback" und nicht nach der sprachlichen Perfektion des Endprodukts.

Für Studierende bedeutet das eine Umstellung. Wer es gewohnt ist, am Abend vor der Deadline eine Arbeit zu schreiben, muss umdenken. Ein Portfolio entsteht über Wochen. Es belohnt kontinuierliches Arbeiten und bestraft Prokrastination. Ob das gerechter oder nur anders unfair ist, darüber streiten Didaktiker.

KI als Prüfungsgegenstand: Die integrative Wende

Der vielleicht radikalste Ansatz: KI nicht verbieten, sondern zum Prüfungsgegenstand machen. Bei KI-integrativen Aufgaben ist die Nutzung von ChatGPT, Claude oder Gemini ausdrücklich Teil der Aufgabe. Was bewertet wird, ist nicht das Ergebnis der KI, sondern wie Studierende damit umgehen.

Typische Aufgabenstellungen sehen so aus: Studierende erhalten eine Forschungsfrage und sollen drei verschiedene KI-Modelle damit konfrontieren. Sie dokumentieren ihre Prompts, vergleichen die Ausgaben und bewerten sie anhand wissenschaftlicher Literatur. Die Bewertung prüft: Wurden die richtigen Fragen gestellt? Wurden die KI-Ausgaben kritisch hinterfragt? Wurden Fehler und Halluzinationen erkannt? Wurden Quellen korrekt überprüft?

Die Euro-FH und die TU Darmstadt setzen dieses Format bereits in einzelnen Kursen ein. Es verlagert die Kompetenzanforderung von „Wissen reproduzieren" auf „Werkzeuge kompetent einsetzen und ihre Grenzen erkennen". Das ist, wenn man ehrlich ist, näher an dem, was Absolventinnen und Absolventen in der Berufspraxis tatsächlich brauchen.

Neue Bewertungskriterien

Mit neuen Prüfungsformaten ändern sich zwangsläufig auch die Bewertungskriterien. Die TU Darmstadt hat vier Dimensionen formuliert, die in der Bewertung stärker gewichtet werden sollen:

Erstens: Eigenleistung jenseits der Zusammenfassung. Hat die Arbeit einen eigenen Standpunkt, der über die Wiedergabe von Quellen hinausgeht?

Zweitens: Persönliche Reflexion. Können Studierende ihre Entscheidungen begründen, auch wenn diese im Nachhinein suboptimal waren?

Drittens: Transparente KI-Dokumentation. Wurde offengelegt, welche KI-Tools in welchem Umfang genutzt wurden?

Viertens: Strategischer Werkzeugeinsatz. Wurde KI gezielt und sinnvoll eingesetzt, oder wurde sie als Abkürzung genutzt, um eigenständiges Denken zu umgehen?

Diese Kriterien verlangen von Lehrenden ein Umdenken. Sprachliche Perfektion verliert an Gewicht, argumentative Tiefe und methodische Transparenz gewinnen. Das hat auch Konsequenzen für Studierende, die bisher mit gut formulierten, aber inhaltlich oberflächlichen Arbeiten durchgekommen sind.

Die Herausforderungen bleiben groß

So überzeugend die neuen Formate klingen, sie lösen nicht alle Probleme. Mündliche Prüfungen erfordern personelle Ressourcen, die an unterfinanzierten Hochschulen fehlen. Portfolios müssen individuell bewertet werden, das skaliert schlecht bei Hunderten von Studierenden pro Kurs.

Die Euro-FH stellte fest, dass 63 Prozent der 100 größten deutschen Hochschulen im Sommer 2023 noch keine angemessenen KI-Richtlinien hatten. Vieles ist seitdem nachgeholt worden, aber die Umsetzung in der Prüfungspraxis hinkt den Leitlinien hinterher. Es reicht nicht, auf dem Papier neue Formate zu beschreiben. Sie müssen in Prüfungsordnungen verankert, von Lehrenden geschult und technisch ermöglicht werden.

Hinzu kommt ein grundsätzliches Dilemma: Studierende sollen KI kompetent nutzen lernen, aber gleichzeitig beweisen, dass sie auch ohne KI können. Wo die Grenze zwischen erlaubter Unterstützung und unerlaubter Übernahme liegt, ist in vielen Fällen unklar. Die KI-Hausarbeit erlaubt?, beantwortet jede Hochschule anders.

Was Studierende jetzt wissen müssen

Die Umstellung auf neue Prüfungsformate betrifft dich direkt. Hier ist, worauf du dich einstellen solltest.

Mündliche Verteidigungen werden wahrscheinlicher. Wenn du eine Hausarbeit oder Abschlussarbeit schreibst, bereite dich darauf vor, sie im Gespräch erklären zu müssen. Kenne die Kernargumente, die Methodik und die Schwächen deiner Arbeit. Wenn du sie selbst geschrieben hast, ist das kein Problem. Wenn nicht, wird es eines.

Dokumentiere deinen Arbeitsprozess. Speichere Entwürfe, Recherche-Notizen und Überarbeitungsversionen. Auch wenn deine Hochschule noch kein Portfolio verlangt, hilft dir die Dokumentation bei einer mündlichen Verteidigung und schützt dich vor Fehlalarmen von KI-Detektoren.

Lerne, KI-Tools kritisch zu nutzen. Prüfungen, bei denen du ChatGPT-Outputs analysieren und bewerten sollst, werden häufiger. Das ist eine echte Kompetenz, nicht nur für die Uni, sondern für den Arbeitsmarkt.

Informiere dich über die Regeln deiner Hochschule. Die KI-Regelungen sind uneinheitlich und ändern sich schnell. Was dieses Semester erlaubt war, kann nächstes Semester anders aussehen.

Nutze einen KI-Scan vor der Abgabe. Unser KI Scan zeigt dir, welche Passagen ein Detektor als verdächtig einstufen könnte. So kannst du problematische Stellen überarbeiten oder belegen, warum sie von dir stammen.

Häufige Fragen

Welche neuen Prüfungsformate nutzen Hochschulen wegen KI?

Die wichtigsten neuen Formate sind mündliche Verteidigungen und Reflexionsgespräche, prozessorientierte Portfolios, KI-integrative Aufgaben (bei denen Studierende KI-Outputs kritisch analysieren) und Kombinationsformate aus schriftlichen Arbeiten mit mündlichen Komponenten. Ziel ist es, Verständnis und kritisches Denken zu prüfen statt nur das Endprodukt.

Werden schriftliche Hausarbeiten durch KI abgeschafft?

Nein, schriftliche Arbeiten werden nicht abgeschafft, aber verändert. Viele Hochschulen ergänzen sie durch mündliche Reflexionsgespräche oder verlangen eine Prozessdokumentation. Manche Prüfungsordnungen sehen vor, dass bis zu 50 Prozent der Bewertung auf der mündlichen Verteidigung basieren kann.

Was ist ein KI-integratives Prüfungsformat?

Bei KI-integrativen Prüfungen nutzen Studierende KI-Tools bewusst als Teil der Aufgabe. Sie formulieren Prompts, analysieren die KI-Ergebnisse kritisch, vergleichen verschiedene KI-Modelle und überprüfen die Ausgaben anhand wissenschaftlicher Quellen. Bewertet wird die Kompetenz im Umgang mit KI, nicht die Vermeidung von KI.

Muss ich mich auf mündliche Prüfungen vorbereiten?

Ja, die Wahrscheinlichkeit steigt, dass du deine schriftlichen Arbeiten mündlich verteidigen musst. Bereite dich vor, indem du deine Kernargumente, Methodik und auch die Schwächen deiner Arbeit kennst. Halte Entwürfe und Recherche-Notizen bereit, um deinen Arbeitsprozess belegen zu können.

Wie wirkt sich das auf meine Bachelorarbeit aus?

Bei Abschlussarbeiten gewinnt die mündliche Verteidigung an Gewicht. Manche Hochschulen gewichten sie bereits mit bis zu 50 Prozent der Note. Du solltest deinen gesamten Arbeitsprozess dokumentieren und in der Lage sein, jede Entscheidung in deiner Arbeit zu begründen. Eine vorherige Prüfung mit einem KI-Scan kann helfen, problematische Passagen vor der Abgabe zu identifizieren.

Zurück zum Blog