NCA Social Media
Grünes Browser Fenster mit Schriftzug Langfuse, Rakete und Lupe im Tech Stil

Was ist Langfuse?

Langfuse ist eine Open Source Plattform für LLM Observability. Sie sammelt Traces, Metriken und Evaluierungen, damit Entwickler KI Anwendungen auf Basis von Large Language Models nachvollziehen, debuggen und verbessern können. Langfuse steht unter MIT Lizenz frei zur Verfügung, lässt sich selbst hosten und wurde im Y Combinator Batch W23 gestartet.

Im Kern beantwortet Langfuse eine Frage, die klassisches Monitoring nicht abdeckt: nicht nur ob ein Aufruf funktioniert hat, sondern ob die Antwort gut war. Über verschachtelte Traces macht die Plattform komplexe Abläufe sichtbar, etwa Chains, Tool Aufrufe von Agenten oder Retrieval Schritte in einem RAG Framework wie LlamaIndex. So deckt Langfuse den gesamten Lebenszyklus ab: entwickeln, überwachen und testen.

Genutzt wird Langfuse von Teams, die Prompts, Agenten und KI Features in Production betreiben. Die Plattform integriert sich mit SDKs für Python und TypeScript sowie mit Frameworks wie LangChain und LangGraph. Im Januar 2026 wurde Langfuse von ClickHouse übernommen, bleibt aber Open Source und selbst hostbar.

Langfuse mit NCA: Schnelle Hilfe vom Experten

Never Code Alone baut und betreibt KI Anwendungen seit Jahren in Production. Lokale Inference läuft bei uns über Ollama mit offenen Modellen, Monitoring über Sentry und Grafana, Automatisierung über n8n. Wir kennen die Lücke, die Langfuse schließt: Wer Prompts, Agenten und Retrieval in Production fährt, braucht Sichtbarkeit über Qualität, Kosten und Latenz, nicht nur über Uptime.

Wir helfen Teams, LLM Observability sauber in den eigenen Workflow einzuordnen, von der Frage ob selbst gehostetes Langfuse oder eine andere Lösung passt bis zur Integration in bestehende Pipelines. Konkret unterstützen wir beim Vibe Coding Consulting, beim Aufbau einer DSGVO konformen self hosted KI, beim Selbst Hosten von KI Assistenten, beim Codebase Audit für KI generierten Code und beim Aufbau von CI/CD Pipelines für KI Code samt Code Qualität mit KI Agenten.

Langfuse und LLM Observability mit NCA

Finde das passende Angebot für dein Projekt

🤖

Hey! Ich bin CodeBot. Lass uns herausfinden, wie wir dein Projekt zum Fliegen bringen.

Was soll entstehen?

Die Kernfunktionen von Langfuse im Überblick

Langfuse bündelt mehrere Bausteine, die zusammen das ergeben, was die Gründer als LLM Engineering Plattform bezeichnen. Statt einzelner Insellösungen greift alles in einen gemeinsamen Datenfluss ineinander.

  • Tracing: Verschachtelte Spans bilden komplette Abläufe ab, inklusive multimodaler Inhalte wie Text, Bilder und Audio. So wird sichtbar, an welcher Stelle einer Chain oder eines Agenten ein Problem entsteht.
  • Evaluierungen: Langfuse unterstützt LLM as a judge, heuristische Checks und manuelles Feedback. Damit lässt sich messen, ob Antworten gut sind, nicht nur ob sie technisch durchliefen.
  • Prompt Management: Prompts werden versioniert verwaltet und über einen nativen MCP Server abrufbar. Ähnlich wie das Model Context Protocol Agenten an Datenquellen anbindet, holt sich ein Agent seine Prompts direkt aus Langfuse.
  • Datasets und Experiments: Test Datensätze und Experimente erlauben es, Prompt und Agenten Änderungen vor dem Production Release zu bewerten.
  • Dashboards und Metriken: Kosten nach Modell oder Nutzer, Latenz Verteilungen und Qualitätsmetriken laufen in einem visuellen Dashboard zusammen.

Diese Bausteine sind besonders dann wertvoll, wenn Anwendungen über einfache Einzelaufrufe hinausgehen, etwa bei Graph basierten Multi Agent Workflows oder bei Retrieval mit Embedding Modellen. Erst die durchgehende Sichtbarkeit macht solche Systeme wartbar.

Die ClickHouse Übernahme: Was sich ändert und was bleibt

Am 16. Januar 2026 hat ClickHouse Langfuse übernommen, zeitgleich mit einer Series D Runde, die ClickHouse auf eine Bewertung von 15 Milliarden Dollar hob. Für Bestandsnutzer ist die wichtigste Nachricht zuerst: Langfuse bleibt unter MIT Lizenz, bleibt selbst hostbar, und an der Preisstruktur ändert sich laut Ankündigung nichts.

Die Übernahme formalisiert eine technische Abhängigkeit, die schon vorher bestand. Langfuse läuft architektonisch auf ClickHouse, weil PostgreSQL allein die Kombination aus hohem Schreibdurchsatz und schnellen analytischen Abfragen nicht mehr trug. In der Praxis heißt das: eine self hosted Production Installation braucht heute PostgreSQL, ClickHouse und Redis. Das ist ein spürbarer Infrastruktur Aufwand, den man vor der Entscheidung kennen sollte.

Parallel treibt das Team die Entwicklung weiter. Mit Langfuse V4, aktuell in der Beta, wurde das Datenmodell auf eine einzige unveränderliche Observations Tabelle umgebaut, was laut Anbieter deutlich schnellere Dashboards und einen höheren Durchsatz bringt. Die Roadmap bleibt damit erkennbar aktiv.

Wir benennen auch das Risiko offen: Die Geschichte von Open Source Übernahmen kennt Fälle, in denen Lizenzversprechen nach ein bis zwei Jahren still relizenziert wurden. Für ClickHouse spricht, dass Open Source Teil des eigenen Geschäftsmodells ist, denn je mehr Teams selbst hosten, desto leichter der Weg in die Managed Cloud. Wer Vendor Lock In grundsätzlich vermeiden will, findet in unserem Leitfaden zur Auswahl von KI Modellen ohne US Anbieter die passende Denkrichtung.

LLM Observability in vier Reifegraden

LLM Observability entsteht nicht auf einen Schlag, sondern in Stufen. Viele Teams starten im Blindflug und merken erst in Production, dass ihnen Sichtbarkeit über Qualität und Kosten fehlt. Die folgende Einordnung zeigt, wo Langfuse ansetzt und worin sich reines Logging von echtem LLM Engineering unterscheidet.

Reifegrade der LLM Observability

Reifegrad Tools und Plattformen Was sichtbar wird
Stufe 1: NONE Keine, nur vereinzelte App Logs Kaum Sichtbarkeit, Fehler fallen erst beim Nutzer auf
Stufe 2: LOGS stdout, Sentry für Errors Man sieht ob es crasht, aber nicht ob die Antwort gut war
Stufe 3: TRACING Langfuse Tracing und Dashboards Komplette Abläufe, Kosten und Latenz pro Aufruf
Stufe 4: EVALS Langfuse Evals, Datasets und Experiments Gemessene Qualität, Tests vor jedem Production Release
Grünes Balkendiagramm der vier Observability Reifegrade NONE LOGS TRACING EVALS

Self Hosting oder Cloud: Die DSGVO Frage

Langfuse gibt es als Managed Cloud unter cloud.langfuse.com mit Regionen in der EU und den USA sowie als self hosted Variante unter MIT Lizenz. Für deutsche Teams mit sensiblen Daten ist die self hosted Option der entscheidende Hebel: Traces, Prompts und Nutzereingaben verlassen die eigene Umgebung nicht. Das passt zu Szenarien, die wir im Detail bei lokaler KI für Compliance und Berufsgeheimnis beschreiben.

Die Inference selbst hält man am besten ebenfalls im Haus. Bei NCA läuft sie über Ollama mit offenen Modellen wie Qwen3 Coder. Für höhere Last sind vLLM oder LM Studio sinnvolle Bausteine. Langfuse legt sich als Observability Schicht sauber über diese lokale Inference.

Wer Self Hosting nicht selbst stemmen will, kann die nötige Infrastruktur aus PostgreSQL, ClickHouse und Redis als gehostete Lösung betreiben lassen. Für DSGVO konforme Enterprise Setups arbeiten wir mit unserem Infrastruktur Partner Conversis aus Duisburg zusammen, der Hosting und Betrieb in Deutschland abdeckt.

Langfuse einordnen: Stärken, Grenzen und wann es passt

Langfuse ist ein starker Kandidat, sobald LLM Features den Prototyp Status verlassen. Als Experten für KI gestützte Entwicklung ordnen wir das Tool ein, statt es pauschal zu empfehlen. Entscheidend ist immer der konkrete Use Case.

  • Open Source und self hostbar: Die MIT Lizenz und die Self Hosting Option machen Langfuse für regulierte Branchen attraktiv, die Daten nicht aus der Hand geben dürfen.
  • Breite SDK Abdeckung: Stabile SDKs für Python und TypeScript sowie Integrationen für gängige Frameworks senken die Einstiegshürde.
  • Durchgängiger Loop: Tracing, Evals und Experiments greifen ineinander, statt drei getrennte Werkzeuge zu erfordern.
  • Infrastruktur Aufwand: Production Self Hosting verlangt PostgreSQL, ClickHouse und Redis, was kleine Teams unterschätzen.
  • Kosten bei dichten Agenten Workflows: Lange agentische Läufe mit vielen Tool Aufrufen erzeugen viele Observations, die einheitenbasierte Abrechnung kann teurer werden als erwartet.
  • Lernkurve im Datenmodell: Das beobachtungszentrierte Modell ist mächtig, braucht aber Einarbeitung.

Für ein einzelnes Skript oder einen einfachen Chatbot ist Langfuse überdimensioniert, hier reichen oft Logs und ein schlankes Interface wie Open WebUI. Sobald aber Qualität, Kosten und Reproduzierbarkeit zählen, spielt Langfuse seine Stärken aus. Ob es in deinem Projekt die richtige Wahl ist, klären wir im Beratungsprojekt anhand deiner Architektur und deiner Compliance Anforderungen.

Langfuse stays open source and self-hostable. There are no planned changes to licensing.

Marc Klingen, Mitgründer und CEO Langfuse – Langfuse Blog

Was bei LLM Observability zählt: Drei Muster aus NCA Projekten

In Beratungsprojekten rund um KI gestützte Entwicklung begegnen uns bei Observability immer wieder dieselben drei Muster.

  • Observability zu spät gedacht: Teams bauen Agenten und Chains, ohne Tracing einzuplanen, und stehen in Production ohne Antwort auf die Frage, warum eine Ausgabe schlecht war. Wir setzen Observability deshalb früh auf, idealerweise schon im Stadium der Vibe Coding Best Practices.
  • Qualität statt nur Uptime: Klassisches Monitoring meldet Crashes, sagt aber nichts über Antwortqualität. Hier verbinden wir Tracing mit Evals, ähnlich wie wir KI Code Review automatisieren, um Regressionen vor dem Release zu fangen.
  • Datenhoheit zuerst: Sensible Prompts und Eingaben gehören nicht unkontrolliert in eine fremde Cloud. Wir planen Observability so, dass sie zu einer DSGVO konformen self hosted KI passt.

Ob beim Retten eines KI Projekts, beim Security Audit oder beim Aufbau sauberer CI/CD Pipelines: Sichtbarkeit über das Verhalten von KI Systemen ist die Grundlage, auf der belastbare Software entsteht. Wer tiefer einsteigen will, findet im Vergleich der Vibe Coding Modelle und beim Leitfaden Top 10 Vibe Coding Tools die passenden Bausteine.

CYPRESS.IO Ambassador und IT Consultant für QA Engenieering und Qualität in PHP Projekten.

NCA Vibe Coding Consulting

Roland Golla ist Entwickler aus Leidenschaft – seit über 20 Jahren. Er hat hunderte Projekte begleitet, von Legacy-Refactoring bis KI-Integration. Bei Vibe Coding verbindet er das Beste aus beiden Welten: Die Geschwindigkeit von KI-generiertem Code mit der Qualität professioneller Softwareentwicklung. Kein Bullshit, keine Agentur-Floskeln – direkte Hilfe von jemandem, der selbst täglich im Code steckt.

Häufige Fragen zu Langfuse

Die wichtigsten Fragen zu Langfuse, LLM Observability und der ClickHouse Übernahme, kurz und praxisnah beantwortet.

Was ist Langfuse 2026?

Langfuse ist eine Open Source Plattform für LLM Observability. Sie sammelt Traces, Evaluierungen und Metriken, damit Teams KI Anwendungen debuggen und verbessern können. Seit Januar 2026 gehört Langfuse zu ClickHouse, bleibt aber unter MIT Lizenz und selbst hostbar. Genutzt wird es für Tracing, Prompt Management und Qualitätsmessung in Production.

Ist Langfuse 2026 noch Open Source?

Ja. Langfuse bleibt 2026 unter MIT Lizenz, auch nach der Übernahme durch ClickHouse. Self Hosting bleibt ein erstklassiger Weg, und laut Anbieter sind keine Lizenzänderungen geplant. Kernfunktionen wie Tracing, Evals und Prompt Management stehen weiterhin frei zur Verfügung.

Was kostet Langfuse 2026?

Langfuse bietet eine kostenlose Hobby Stufe und mehrere bezahlte Cloud Tarife ohne Gebühr pro Nutzer. Die self hosted Variante unter MIT Lizenz ist kostenfrei, hier fallen nur die eigenen Infrastruktur Kosten an. Da sich Tarife ändern, lohnt ein Blick auf die offizielle Preisseite.

Welche Infrastruktur braucht Langfuse 2026?

Eine self hosted Production Installation braucht 2026 PostgreSQL, ClickHouse und Redis. ClickHouse trägt die hohe Telemetrie Last, PostgreSQL die strukturierten Metadaten, Redis das Caching. Für kleine Tests genügt eine schlankere Einrichtung, für echten Betrieb solltest du den Aufwand der drei Komponenten einplanen.

Was ist der Unterschied zwischen Langfuse und LangSmith 2026?

Beide sind Plattformen für LLM Observability. Langfuse ist Open Source unter MIT Lizenz und selbst hostbar, LangSmith ist proprietär und eng an LangChain gebunden. Für Teams mit DSGVO Anforderungen oder dem Wunsch nach voller Datenhoheit ist die Self Hosting Option von Langfuse oft der entscheidende Vorteil.

Wofür wird Langfuse eingesetzt?

Langfuse deckt den Lebenszyklus von LLM Anwendungen ab: Tracing macht Abläufe sichtbar, Evaluierungen messen die Antwortqualität, Prompt Management versioniert Prompts, und Datasets samt Experiments erlauben Tests vor dem Release. Dashboards zeigen Kosten, Latenz und Qualität in einer Oberfläche.

Kann ich Langfuse DSGVO konform betreiben?

Ja. Über die self hosted Variante bleiben Traces, Prompts und Eingaben in der eigenen Umgebung und verlassen sie nicht. In Kombination mit lokaler Inference über Ollama lässt sich eine durchgehend DSGVO konforme Architektur aufbauen. NCA berät beim Aufbau solcher Setups.

Welche SDKs unterstützt Langfuse?

Langfuse bietet stabile SDKs für Python und TypeScript sowie Integrationen für gängige Frameworks wie LangChain, LangGraph und LlamaIndex. Die Instrumentierung erfolgt über Dekoratoren oder die Low Level SDK und funktioniert grundsätzlich modellunabhängig mit beliebigen LLMs.

Was bedeutet die ClickHouse Übernahme für Bestandsnutzer?

Für Bestandsnutzer ändert sich zunächst nichts: gleiche Endpunkte, gleiche Cloud, gleiche Self Hosting Option. ClickHouse betont, dass Langfuse Open Source bleibt. Mittelfristig soll die engere Verzahnung mit ClickHouse mehr Performance und eine schnellere Roadmap bringen.

Was ist LLM as a judge in Langfuse?

LLM as a judge ist eine Evaluierungsmethode, bei der ein Sprachmodell die Ausgabe einer KI Anwendung bewertet. Langfuse unterstützt diesen Ansatz neben heuristischen Checks und manuellem Feedback. So lässt sich Antwortqualität automatisiert und in großem Umfang messen, statt nur Stichproben zu prüfen.

Funktioniert Langfuse mit lokalen Modellen über Ollama?

Ja. Langfuse arbeitet modellunabhängig und lässt sich als Observability Schicht über lokale Inference legen, etwa über Ollama oder vLLM. Damit lassen sich auch self hosted Setups mit offenen Modellen wie Qwen oder Llama vollständig tracen und evaluieren.

Was ist Langfuse V4?

Langfuse V4 ist eine Neufassung des Datenmodells, aktuell in der Beta. Sie fasst Daten in einer einzigen unveränderlichen Observations Tabelle zusammen, was laut Anbieter deutlich schnellere Dashboards und einen höheren Durchsatz ermöglicht. Experiments bringen zusätzlich CI Workflows und neue Bewertungsarten mit.

Claude Cowork

Was ist Claude Cowork 2026? Der KI-Agent von Anthropic für Desktop-Automatisierung. Funktionen, Anwendungsfälle und Einschränkungen im Überblick.

Cursor BugBot – KI-gestütztes Debugging in Echtzeit

Cursor BugBot ist Cursors KI-Agent für automatisches Code-Review und Debugging direkt im Editor. Mit über 2 Millionen analysierten Pull Requests pro Monat und einer Resolution Rate von 70 % ist er 2026 ein zentrales Tool im Vibe-Coding-Workflow.

MoltBot (ClawdBot)

Open-Source KI-Assistent mit 60.000+ GitHub Stars, der über WhatsApp, Telegram und andere Messaging-Apps gesteuert wird.

OpenClaw – Der autonome KI-Agent

Der dreifach umbenannte KI-Agent – von ClawdBot über MoltBot zu OpenClaw. 100.000+ GitHub Stars, autonome Aufgabenausführung, und erhebliche Sicherheitsbedenken.