Warum liest mein Agent dieselbe Datei erneut und verschwendet Tokens?

Teil von Token-Effizienz ist ein Kontextproblem

Dein Agent liest dieselbe Datei erneut, weil jeder Schritt vergisst, dass er sie schon gelesen hat. Ohne eine geteilte, adressierbare Ebene lädt das Modell die volle Datei jedes Mal neu, wenn es ein Detail braucht, und du zahlst die ganze Datei erneut. Die Lösung ist, dem Agenten einen Ort zu geben, an dem er Dateien über eine stabile Adresse referenziert, statt ihren Inhalt neu einzulesen.

Was kostet das erneute Lesen wirklich?

Eine einzelne 2.000-Token-Datei, in einer Aufgabe viermal neu gelesen, sind 8.000 Tokens für eine Datei, die der Agent bereits hatte. Über eine Session mit Dutzenden Dateien ist das oft der größte Einzelposten deiner Rechnung, größer als das eigentliche Nachdenken.

Warum reicht Caching allein nicht?

Prompt-Caching kann den Preis einer Wiederholung senken, hat aber zwei Grenzen. Es kostet weiterhin mehr pro Token als frischer Kontext, und es verfällt in dem Moment, in dem sich die Datei ändert. Ein Agent, der Code oder Dokumente bearbeitet, ändert Dateien ständig, der Cache bricht also genau dann, wenn du ihn brauchst.

Wie löst eine geteilte Datenebene das?

In einer geteilten Datenebene hat jede Datei eine stabile Adresse. Der Agent liest sie einmal in die Ebene und referenziert dann diese Adresse in späteren Schritten, statt den vollen Inhalt erneut in den Prompt zu kleben. Ein zweiter Lesevorgang einer unveränderten Datei wird zu einem günstigen Lookup statt einer vollen Neueinlesung, und Änderungen werden verfolgt, sodass der Agent nur neu liest, was sich wirklich bewegt hat.

adlass bietet das über MCP: Deine Dateien liegen in geteilten Spaces, und der Agent arbeitet per Referenz gegen sie, wiederholter Zugriff kostet also einen Bruchteil einer vollen Lesung.

Häufige Fragen

Kann ich dem Agenten einfach sagen, Dateien nicht neu zu lesen?
Anweisungen helfen geringfügig, aber der Agent liest neu, weil ihm der Inhalt im nächsten Schritt tatsächlich fehlt. Er braucht einen Ort, von dem aus er die Datei referenziert, nicht nur eine Regel.
Betrifft das nur Coding-Agenten?
Nein. Jeder Agent, der über Dokumente, Datensätze oder lange Dateien arbeitet, trifft auf dieselben Wiederhol-Kosten. Vertragsprüfung und Datenarbeit verschwenden Tokens genauso wie Coding-Agenten.

Arbeite mit deinen Agenten auf denselben Daten

adlass ist die geteilte Datenebene, auf der du, dein Team und ihre Agenten an denselben Dokumenten und Datensätzen arbeiten.