Headroom · Open Source · fast 50k Stars

Bis zu 95% weniger Token, gleiche Antworten.

Die Leute mit den kleinsten Claude-Rechnungen prompten nicht besser als du. Sie haben Headroom installiert. Jedes Mal wenn Claude eine Datei, Logs oder einen Haufen Daten bekommt, ist die Hälfte davon Ballast, den das Modell nicht braucht, und du zahlst trotzdem für jeden Token. Headroom, gebaut von einem Netflix-Ingenieur und mit fast 50.000 GitHub-Stars, setzt sich davor und komprimiert den Ballast, bevor er beim Modell ankommt. Ergebnis: dieselben Antworten mit 60 bis 95% weniger Token. Installiert in einem Befehl.

Zur SKAILE Academy → Direkt installieren ↓

Wie es funktioniert

Es wirft den Ballast raus, nicht die Antwort.

Headroom sitzt zwischen Claude Code und dem Modell und schickt nur das weiter, was wirklich gebraucht wird. Den Rest holt das Modell bei Bedarf nach.

Die Hälfte ist Ballast

Das Problem

Jedes Mal wenn du Claude eine Datei, Logs oder einen Haufen Daten gibst, ist viel davon Müll, den das Modell gar nicht braucht. Es landet trotzdem im Context, und du zahlst für jeden einzelnen Token mit.

Mehr Context heißt nicht bessere Antwort. Nur höhere Rechnung.

Headroom setzt sich davor

Kompression vor dem Modell

Headroom klemmt sich zwischen Claude Code und das Modell und komprimiert Tool-Outputs, Logs, Datei-Reads, DB-Reads und RAG-Ergebnisse, bevor sie ankommen. Ein Content-Router erkennt den Typ (Code, JSON, Logs, Text) und nutzt für jeden den passenden Kompressor.

Läuft lokal auf deiner Maschine, deine Daten bleiben bei dir.

Reversibel, kein Datenverlust

Darum bleiben die Antworten gleich

Wichtig: Headroom löscht nichts blind. Über CCR (Compress-Cache-Retrieve) bekommt das Modell ein Werkzeug, um das volle Original jederzeit nachzuladen, wenn es das wirklich braucht. Genau deshalb messen die Benchmarks 60 bis 95% weniger Token bei 100% gleicher Antwort-Genauigkeit.

Im Schnitt rund 87% weniger Token, Mathe-Benchmark unverändert.

SKAILE Academy

Willst du Claude Code wirklich effizient nutzen, nicht nur günstiger? Auf der SKAILE Academy zeige ich dir die Tools, Workflows und Setups, die im Alltag echt was bringen.

Zur SKAILE Academy →

Gut zu wissen

Ein Befehl, und mehr als nur sparen.

Headroom ist kein Marketplace-Plugin, sondern ein schlanker Proxy, der sich vor dein Tool setzt. Das macht ihn flexibel.

Ein Befehl, null Umbau

headroom wrap claude

Ein Befehl startet einen lokalen Proxy, Claude Code läuft danach ganz normal weiter, nur komprimiert. Du musst nichts an deinem Code oder deinem Setup ändern.

Nicht nur Claude Code

Codex, Cursor, Aider, Copilot

Derselbe Proxy funktioniert mit Codex, Cursor, Aider und Copilot CLI, oder als MCP-Server und Library. Alles was OpenAI-kompatibel ist, läuft drüber.

Es lernt aus deinen Fehlern

headroom learn

Mit headroom learn analysiert es deine fehlgeschlagenen Sessions und schreibt die Korrekturen direkt in deine CLAUDE.md, damit dieselben Fehler nicht wieder passieren.

Open Source, kostenlos

Apache 2.0 · fast 50k Stars

Headroom ist Open Source (Apache 2.0), frei auch für kommerzielle Nutzung, und hat auf GitHub fast 50.000 Stars. Gebaut von einem Netflix-Ingenieur, läuft komplett lokal.

Installieren · Zum Kopieren

Zwei Zeilen, und dein Claude spart.

Headroom ist Open Source und in unter einer Minute eingerichtet. Einmal installieren, dann Claude Code mit einem Befehl durch Headroom starten. Danach läuft alles wie immer, nur mit einem Bruchteil der Token.

terminal · headroom ready

✓headroom-ai installiert (pip oder npm)

✓headroom wrap claude gestartet (lokaler Proxy)

✓Tool-Outputs, Logs und Datei-Reads werden komprimiert

✓Modell lädt Originale bei Bedarf per headroom_retrieve nach

✓60 bis 95% weniger Token, gleiche Antworten

Komprimiert reversibel, das Modell sieht bei Bedarf das Original.

# 1. Headroom installieren (Python; Node geht genauso):
pip install "headroom-ai[all]"
# Alternativ mit Node:
# npm install headroom-ai

# 2. Claude Code durch Headroom starten (ein Befehl, kein Umbau):
headroom wrap claude

# Das war's. Claude Code läuft normal weiter, nur komprimiert.

# Optional: aus deinen Sessions lernen, schreibt Fixes in deine CLAUDE.md:
headroom learn

# Open Source (Apache 2.0), fast 50k Stars:
# github.com/headroomlabs-ai/headroom

SKAILE Academy

Claude Code richtig lernen.

Token sparen ist ein guter Anfang. Wenn du Claude Code wirklich produktiv nutzen willst, mit echten Workflows, Tools und Setups, dann bist du auf der SKAILE Academy richtig.

SKAILE Academy

Zur Academy

Kein langes Formular: ein Klick und du bist direkt da.

Zur SKAILE Academy →