KI-Assistenten gehören längst zum Arbeitsalltag. Mit ihnen entsteht aber eine neue betriebliche Messgröße: der Token-Verbrauch. Wer viele Token verbraucht, gilt schnell als „produktiv“ – und genau das setzt Fehlanreize. Bei Amazon und anderen US-Konzernen ist daraus bereits ein Phänomen geworden, das unter dem Stichwort Tokenmaxxing diskutiert wird. Für das Management stellen sich zwei Fragen, die juristisch sauber zu trennen sind: Darf der Arbeitgeber die Tokennutzung seiner Beschäftigten überhaupt überwachen? Und wie ist es arbeitsrechtlich zu bewerten, wenn Mitarbeiter ihren Token-Verbrauch künstlich aufblähen?
Was bislang geschah
Mehrere große Technologiekonzerne haben begonnen, die interne KI-Nutzung ihrer Belegschaft zu messen, teilweise sogar zu ranken. Token – die kleinste Abrechnungseinheit großer Sprachmodelle – werden dabei zum Proxy für Engagement und Produktivität. Die vorhersehbare Reaktion: Mitarbeiter erzeugen künstlich hohen Verbrauch, um in Rankings besser dazustehen, ohne dass dem ein echter Wertbeitrag gegenübersteht. Amazon hat ein solches internes KI-Ranking nach Kritik wieder gestoppt, weil das Messen des Token-Verbrauchs als Leistungsindikator schlicht die falschen Anreize setzt. Branchenbeobachter bezeichnen „Tokenmaxxing“ entsprechend als wenig aussagekräftige, eher schädliche Optimierungstaktik.
Für Unternehmen ist das kein bloßes Kuriosum: Sobald eine Kennzahl personenbezogen erhoben, ausgewertet und mit Konsequenzen verknüpft wird, betritt man arbeits-, datenschutz- und betriebsverfassungsrechtlich vermintes Gelände.
Ist die Überwachung der Tokennutzung rechtlich zulässig?
Eine Rechtsprechung speziell zur Token-Überwachung existiert (noch) nicht. Das ist jedoch unschädlich, denn die Maßstäbe sind etabliert: Die Token-Auswertung ist datenschutzrechtlich nichts grundlegend anderes als die Auswertung von Browserverläufen, Logdaten oder Tastatureingaben – nur ein neuer Anwendungsfall einer bekannten Konstellation.
Rechtsgrundlage und Erforderlichkeit
Ausgangspunkt ist § 26 Abs. 1 S. 1 BDSG. Beschäftigtendaten dürfen verarbeitet werden, soweit dies für die Durchführung des Beschäftigungsverhältnisses erforderlich ist – wobei „erforderlich“ „geboten und nicht nur nützlich“ bedeutet und bei mehreren gleich wirksamen Mitteln stets das mildeste zu wählen ist. Leistungs- und Verhaltenskontrollen sind dabei grundsätzlich Teil eines jeden Beschäftigungsverhältnisses, präventive Kontrollen eingeschlossen.
Die zentrale Grenze: keine lückenlose Total- und Dauerüberwachung
Hier liegt das eigentliche Risiko. Eine lückenlose technische Überwachung am Arbeitsplatz ist nach ständiger BAG-Rechtsprechung wegen des hohen Überwachungsdrucks und der schweren Persönlichkeitsrechtsbeeinträchtigung regelmäßig rechtswidrig. Die Keylogger-Entscheidung (BAG, 27.7.2017 – 2 AZR 681/16) zeigt: Selbst der offene Einsatz einer Software, die fortlaufend sämtliche Eingaben protokolliert, ist unzulässig, wenn kein konkreter, durch Tatsachen begründeter Verdacht einer Straftat oder schweren Pflichtverletzung besteht. Eine permanente, vollständige Aufzeichnung jeder KI-Interaktion nähert sich funktional genau diesem Keylogger an – und wäre damit kaum zu rechtfertigen.
Es kommt entscheidend auf den Zweck an
Maßgeblich ist eine saubere Trennung der verfolgten Zwecke, weil sich daran Rechtsgrundlage und Eingriffsschwelle bemessen:
| Zweck der Auswertung | Rechtsgrundlage | Schwelle / Grenze |
|---|---|---|
| Abrechnung / Kapazitätssteuerung (aggregiert) | § 26 Abs. 1 S. 1 BDSG / Art. 32 DSGVO | zulässig, wenn nicht personenscharf zur Leistungsbewertung |
| Allgemeine Leistungs-/Verhaltenskontrolle | § 26 Abs. 1 S. 1 BDSG | erforderlich, verhältnismäßig, keine Totalkontrolle |
| Aufklärung schwerer Pflichtverletzungen | § 26 Abs. 1 S. 1 BDSG | konkreter, dokumentierter Verdacht |
| Aufdeckung von Straftaten | § 26 Abs. 1 S. 2 BDSG | dokumentierter Anfangsverdacht gegen abgrenzbaren Personenkreis |
Eine aggregierte Auswertung von Token-Volumina zur Kostensteuerung ist also etwas völlig anderes als die individualisierte Frage, wer wie oft und wofür KI nutzt. Letztere ist eine Verhaltens- und Leistungskontrolle mit erheblicher Eingriffstiefe.
Lehre aus dem Amazon-Fall
Einen instruktiven Gegenpol bietet die Entscheidung des VG Hannover zum Amazon-Handscanner-System (9.2.2023 – 10 A 6199/20). Dort wurde die fortlaufende, offene Erhebung von Leistungsdaten auf § 26 Abs. 1 S. 1 BDSG gestützt, weil sie lediglich eine objektive Messung der Leistung darstelle. Diese Entscheidung weicht allerdings ausdrücklich von der BAG-Keylogger-Linie ab und wird selbst von Datenschützern kritisch gesehen – das letzte Wort ist nicht gesprochen. Für die Token-Frage folgt daraus: Eine transparente, aggregierte Erfassung ist eher tragfähig als eine inhaltliche, individualisierte Auswertung der Prompts.
Sonderproblem Inhaltsauswertung
Sobald die Überwachung in eine inhaltliche Auswertung der Prompts übergeht, verschärft sich die Lage. Prompts können höchstpersönliche Inhalte enthalten und damit das Recht am eigenen Wort sowie unter Umständen Art. 9 DSGVO (besondere Datenkategorien) berühren. Maßstab der Angemessenheit sind nach dem BAG Anlass, Zweck, Dauer, Art und Intensität der Überwachung sowie der erzeugte Anpassungsdruck. Die Parallele zum Affective Computing ist deutlich: Je tiefer aus den Daten Rückschlüsse auf die Person gezogen werden, desto eher kippt die Verhältnismäßigkeit.
Mitbestimmung ist Pflicht
Praktisch unverzichtbar ist die Beteiligung des Betriebsrats. Nach § 87 Abs. 1 Nr. 6 BetrVG genügt bereits die Erfassung von Logdaten, um ein IT-Tool als Überwachungseinrichtung zu klassifizieren – die Einführung ist damit regelmäßig mitbestimmungspflichtig. Ein System, das Tokennutzung pro Mitarbeiter protokolliert, ist objektiv zur Verhaltens- und Leistungskontrolle geeignet und löst die erzwingbare Mitbestimmung aus. Gegenstand der Mitbestimmung ist dabei der Persönlichkeitsschutz, nicht das Datenschutzrecht als solches; die DSGVO ist vorrangiges, zwingendes Recht und der Mitbestimmung insoweit entzogen.
Zwischenfazit
Eine Token-Überwachung ist zulässig, wenn sie zweckklar, verhältnismäßig, transparent und mitbestimmt ausgestaltet ist – idealerweise aggregiert und nicht inhaltlich. Sie wird rechtswidrig, wenn sie zur lückenlosen, individualisierten Dauerkontrolle oder zur inhaltlichen Prompt-Auswertung ohne konkreten Anlass ausartet. Datenschutzwidrig erlangte Erkenntnisse unterliegen zudem grundsätzlich einem Beweisverwertungsverbot, sofern der Verstoß einen eigenen grundrechtlichen Gehalt aufweist – „Datenschutz ist kein Tatenschutz“.
Arbeitsrechtliche Bewertung des Tokenmaxxing
Die Perspektive dreht sich nun um: Nicht der Arbeitgeber, sondern der Arbeitnehmer manipuliert eine Kennzahl. Wer Token künstlich verbraucht, um produktiver zu wirken, ohne tatsächlich Wert zu schaffen, täuscht über seine Arbeitsleistung – und genau diese Konstellation ist arbeitsrechtlich keineswegs neu.
Tokenmaxxing als schwerer Pflichtverstoß – die Privatsurf-Rechtsprechung
Die nächste Parallele liefert die Rechtsprechung zur exzessiven privaten Internetnutzung während der Arbeitszeit. Das BAG und die Instanzgerichte sehen in der zeitintensiven, vertragswidrigen Privatnutzung des Internets oder von Mail-Programmen während der Arbeitszeit einen schweren Pflichtverstoß, der grundsätzlich mit einer Kündigung sanktioniert werden kann. Das LAG Berlin-Brandenburg (14.1.2016 – 5 Sa 657/15) hatte dies bei einem Mitarbeiter angenommen, der an 30 Tagen insgesamt rund 40 Stunden privat surfte. Tokenmaxxing ist strukturell derselbe Fall: Der Arbeitnehmer verwendet bezahlte Arbeitszeit und betriebliche Ressourcen nicht zur geschuldeten Leistung, sondern zur Erzeugung einer Schein-Aktivität. Der entscheidende Unterschied – und die Verschärfung – liegt darin, dass beim Tokenmaxxing ein zusätzliches Täuschungselement hinzutritt: Es geht nicht nur um Zeitverschwendung, sondern um die aktive Manipulation einer Leistungskennzahl.
Heimlichkeit als Verschärfungsfaktor
Aufschlussreich ist die Übertragung der BAG-Maßstäbe zur verdeckten Aufklärung. Das BAG verlangt für eingreifende Aufklärungsmaßnahmen einen Verstoß, der „seiner Natur nach auf Heimlichkeit angelegt ist“ – bei solchen Verhaltensweisen könnten offene Überwachungen regelmäßig nichts zur Aufdeckung beitragen. Tokenmaxxing ist gerade ein heimlich angelegtes Verhalten: Der Arbeitnehmer tarnt fehlende Produktivität durch hohe Verbrauchszahlen. Das hat eine doppelte Konsequenz. Einerseits stützt es arbeitsrechtlich die Schwere des Vorwurfs, weil bewusste Verschleierung das Vertrauensverhältnis stärker erschüttert als bloße Minderleistung. Andererseits eröffnet es dem Arbeitgeber – bei dokumentiertem konkreten Verdacht – nach den BAG-Grundsätzen den Weg zu eingreifenderen Aufklärungsmaßnahmen, die bei offen erkennbarem Fehlverhalten unzulässig wären.
Beweisschwelle: einfacher Anfangsverdacht, kein dringender Tatverdacht
Will der Arbeitgeber Tokenmaxxing aufklären, gelten die vom BAG präzisierten Verdachtsanforderungen. Die Erhebung personenbezogener Daten zur Aufdeckung setzt lediglich einen einfachen Verdacht im Sinne eines Anfangsverdachts voraus, der über vage Anhaltspunkte und bloße Mutmaßungen hinausreicht; ein dringender Tatverdacht ist nicht erforderlich. Der Verdacht muss sich gegen einen zumindest räumlich und funktional abgrenzbaren Kreis von Arbeitnehmern richten – eine „verdeckte Ermittlung ins Blaue hinein“, ob sich irgendjemand pflichtwidrig verhält, ist dagegen unzulässig. Für die Praxis heißt das: Auffällige, statistisch unplausible Verbrauchsmuster können einen solchen Anfangsverdacht begründen und eine gezielte, individualisierte Auswertung tragen – eine anlasslose Dauerüberwachung der gesamten Belegschaft jedoch nicht.
Keine Sperrwirkung – § 26 Abs. 1 S. 1 BDSG als tragende Grundlage
Da Tokenmaxxing in aller Regel keine Straftat, sondern eine (schwere) Pflichtverletzung ist, ist die zutreffende Rechtsgrundlage § 26 Abs. 1 S. 1 BDSG. Das BAG hat klargestellt, dass § 26 Abs. 1 S. 2 BDSG (Aufdeckung von Straftaten) keine Sperrwirkung gegenüber Satz 1 entfaltet. Die Generalklausel erfasst dabei auch die Ermittlung grober Pflichtverletzungen: Der Begriff „Beendigung“ umfasst die Verarbeitung aller personenbezogenen Daten, die der Arbeitgeber aufgrund eines konkreten Verdachtsmoments zur Erfüllung seiner Darlegungs- und Beweislast in einem potenziellen Kündigungsschutzprozess benötigen könnte. Tokenmaxxing-Daten dürfen also auf § 26 Abs. 1 S. 1 BDSG gestützt erhoben und verwertet werden, sofern der Verdacht konkret und dokumentiert ist.
Verwertbarkeit – „Datenschutz ist kein Tatenschutz“
Hier schließt sich der Kreis: Sind die Nutzungsdaten in Übereinstimmung mit § 26 BDSG und dem Verhältnismäßigkeitsgrundsatz erlangt, liegt keine Verletzung des informationellen Selbstbestimmungsrechts vor, und die Daten dürfen im Kündigungsschutzprozess verwertet werden. Umgekehrt unterliegen datenschutzwidrig erlangte Erkenntnisse grundsätzlich einem Sachvortrags- und Beweisverwertungsverbot. Allerdings führt nicht jeder Datenschutzverstoß automatisch dorthin: Nach der vom BAG geprägten Linie „Datenschutz ist nicht Tatenschutz“ muss der Verstoß einen eigenen grundrechtlichen Gehalt aufweisen, andernfalls bleibt es bei der Verwertbarkeit. Für den rechtmäßig gefilmten – bzw. hier rechtmäßig erfassten – Vorsatztäter gilt: Er ist hinsichtlich der Aufdeckung seiner noch verfolgbaren Pflichtverletzung nicht schutzwürdig.
Detektivkosten und Schadensersatz
Schließlich kann der Arbeitnehmer bei nachgewiesenem vorsätzlichem Fehlverhalten zur Kostentragung herangezogen werden. Nach ständiger Rechtsprechung hat der Arbeitnehmer dem Arbeitgeber die Kosten von Aufklärungsmaßnahmen nach § 280 Abs. 1 BGB zu ersetzen, wenn ein konkreter Tatverdacht zum Zeitpunkt der Beauftragung bestand und der Arbeitnehmer einer vorsätzlichen Vertragspflichtverletzung überführt wird. Erstattungsfähig sind dabei nur Maßnahmen, die ein vernünftiger, wirtschaftlich denkender Arbeitgeber als erforderlich ergriffen hätte. Auf Tokenmaxxing übertragen: Der Aufwand einer gezielten, anlassbezogenen forensischen Auswertung kann ersatzfähig sein – eine vorsorgliche, dauerhafte Totalüberwachung als „ständige Betriebsausgabe“ dagegen nicht.

Der grundlegende Konstruktionsfehler bleibt: Handlungsempfehlungen für das Management
So tragfähig die arbeitsrechtliche Sanktionierung im Einzelfall ist – sie kuriert nur das Symptom. Wer den Token-Verbrauch zur Leistungskennzahl erhebt, optimiert eine Metrik statt eines Ergebnisses und provoziert damit genau das Verhalten, das er sanktionieren will. Amazon hat sein internes KI-Ranking aus eben diesem Grund gestoppt. Die wirksamste Prävention gegen Tokenmaxxing ist daher nicht die schärfere Kontrolle mit ihren erheblichen rechtlichen Fallstricken, sondern der Verzicht auf eine untaugliche Kennzahl.
Für die betriebliche Praxis lassen sich die Erkenntnisse bündeln: Token-Daten sollten nur zweckgebunden (Kosten, Sicherheit, Kapazität) und möglichst aggregiert erhoben werden; eine individualisierte Leistungsbewertung ist heikel und eine inhaltliche Prompt-Auswertung nur bei konkretem Verdacht haltbar. Transparenz gegenüber den Beschäftigten und die rechtzeitige Einbindung des Betriebsrats nach § 87 Abs. 1 Nr. 6 BetrVG sind nicht verzichtbar. Und der Token-Verbrauch taugt schlicht nicht als Produktivitätsmaß – wer ihn dazu macht, produziert Tokenmaxxing als systematische Folge.
- Einziehung im Strafverfahren (2026) – 10. Juni 2026
- Vermögensarrest (2026) – 10. Juni 2026
- Auf der Flucht und Haftbefehl – was tun? – 10. Juni 2026

