Hermes Agent: Self Hosted KI Agent von Nous Research
Hermes Agent von Nous Research: selbstlernender Open Source KI Agent mit Memory, Skills System und MCP. Installation, Vergleich und DSGVO Bewertung.
Mehr erfahren
Hermes Agent Anwendungsfälle reichen vom dauerhaft laufenden Assistenten mit Gedächtnis über automatisierte mehrstufige Workflows bis zu Teams aus parallel arbeitenden Subagenten. Als selbst gehosteter KI Agent erledigt Hermes Agent lange Aufgaben, ohne zwischen Sitzungen den Kontext zu verlieren.
Der Unterschied zu einem klassischen Chatbot liegt in der Infrastruktur: eine persistente Memory Ebene, ein Cron Scheduler für Jobs rund um die Uhr und Delegation an Subagenten mit Terminalzugriff über mehrere Backends. Alles läuft in einer Umgebung, die du vollständig kontrollierst. Wie der Agent technisch aufgebaut ist, zeigt unsere ausführliche Hermes Agent Definitionsseite.
Auf dieser Seite zeigen wir zehn konkrete Anwendungsfälle, ordnen sie nach Reifegrad und erklären, wo agentenbasierte KI in der Praxis echten Mehrwert bringt und wo klassische KI Coding Modelle oder spezialisierte Workflow Tools die bessere Wahl sind.
Never Code Alone ordnet KI Agent Plattformen seit ihrem Aufkommen aktiv ein. Wir verfolgen das Feld in der Tiefe, vergleichen Architekturen und sehen in Beratungsprojekten regelmäßig, wo Teams an der Tool Auswahl und am Schritt vom Prototyp in die Produktion scheitern. Unsere eigenen Agenten Routinen laufen auf einem lokalen Stack mit Ollama, damit Kundendaten und Prompts das eigene Netzwerk nie verlassen.
Wir helfen Teams, agentenbasierte Workflows sauber aufzusetzen: von der Vibe Coding Beratung über die Auswahl passender KI Coding Modelle bis zur Einordnung von Plattformen wie Paperclip im direkten Vergleich mit Hermes Agent. Wenn ein KI generierter Prototyp festhängt, holt unser Team das Projekt mit dem Vibe Coding Rettungsservice zurück auf Kurs.
Finde das passende Angebot für dein Projekt
Hey! Ich bin CodeBot. Lass uns herausfinden, wie wir dein Projekt zum Fliegen bringen.
Was soll entstehen?
Hermes Agent entfaltet seine Stärke schrittweise. Du startest mit einer einzelnen Routine und ergänzt Ebene für Ebene, sobald der Bedarf da ist. Diese vier Reifegrade helfen, den Einstieg realistisch zu planen, statt gleich die volle Komplexität aufzumachen. Die Tabelle zeigt, welche Fähigkeit auf welcher Stufe dazukommt und wofür sie typischerweise genutzt wird.
| Level | Fähigkeit und Tools | Typischer Einsatz |
|---|---|---|
| Level 1: Einzelne Routine | CLI Befehle, einmalige Prompts | Erster Workflow wie ein Morgenbriefing |
| Level 2: Memory | Persistentes Gedächtnis über MEMORY und USER Dateien | Agent merkt sich Stack, Präferenzen und frühere Lösungen |
| Level 3: MCP und Tools | MCP Server, externe APIs, Browser, Dateizugriff | Anbindung an CMS, GitHub und eigene Datenquellen |
| Level 4: Subagenten und Scheduling | delegate task, Cron Jobs, parallele Subagenten | Autonome wöchentliche Routinen über mehrere Quellen |
Die folgenden zehn Anwendungsfälle decken die häufigsten Einsatzgebiete ab. Sie alle teilen ein Merkmal: Die Aufgabe läuft weiter, auch nachdem du den Chat geschlossen hast.
Der grundlegendste Anwendungsfall ist ein Assistent, der dauerhaft läuft und den Kontext über Sitzungen hinweg behält. Zu Beginn jeder Sitzung lädt er ein Gedächtnis aus Fakten über Stack, Tools und Projektkonventionen sowie ein Nutzerprofil. Je länger er läuft, desto weniger Kontext muss man wiederholen.
Gibst du eine Aufgabe mit Zeitplan, speichert der Agent sie als wiederkehrenden Job. Du kannst die CLI heute schließen und nächste Woche über Telegram weitermachen, ohne den Faden zu verlieren. Frühere Sitzungen lassen sich per Volltextsuche durchsuchen, sodass auch Details von vor Wochen wieder auffindbar sind.
Statt einen Artikel in einem einzigen Prompt zu generieren, eignet sich Hermes Agent für eine vierstufige Pipeline aus Recherche, Gliederung, Entwurf und Veröffentlichung. Jeder Schritt nutzt einen eigenen Prompt, und die Ausgabe wird geprüft, bevor es weitergeht. Diese Trennung sorgt für Qualität statt generischem Output.
Ein Stil Skill als kurzes Markdown Playbook hält Satzlänge, Tonalität und Struktur konsistent. Über einen MCP Server lässt sich der Entwurf direkt als unveröffentlichter Beitrag in ein CMS übertragen. Genau dieses Muster setzen wir in unserem KI gestützten Content Marketing um, allerdings auf einem lokalen Modell Stack.
Für umfangreiche Aufgaben teilt Hermes Agent die Arbeit über das Werkzeug delegate task in parallele Stränge auf. Jeder Subagent arbeitet isoliert und liefert nur eine Zusammenfassung zurück, sodass der übergeordnete Agent auf die Orchestrierung fokussiert bleibt. Ein typisches Beispiel ist die parallele Analyse mehrerer Wettbewerber, die am Ende zu einer Tabelle zusammengeführt wird.
Verschiedenen Rollen lassen sich unterschiedlich starke Modelle zuweisen: ein stärkeres für die Koordination, ein leichteres für die Recherche. Standardmäßig bleibt die Delegation flach und damit vorhersehbar, tiefere Hierarchien sind optional. Wie sich diese Orchestrierung von Plattformen für ganze Agent Teams unterscheidet, zeigt unser Vergleich von Paperclip und Hermes Agent.
Hermes Agent übernimmt Shell Automatisierung über mehrere Umgebungen, vom lokalen Rechner über Docker bis zu Remote Servern per SSH. Du beschreibst die Aufgabe in natürlicher Sprache, etwa eine wöchentliche Bereinigung voller Partitionen, und der Agent legt den passenden geplanten Job an, ohne dass du crontab von Hand bearbeitest.
Das gleiche Muster funktioniert für Log Rotation, das Neustarten hängender Dienste oder das Erneuern von Zertifikaten. Ein Freigabesystem kennzeichnet potenziell destruktive Befehle und fragt vor der Ausführung nach. Alle Befehle werden protokolliert, sodass jederzeit nachvollziehbar bleibt, was gelaufen ist.
Über das Model Context Protocol bindet der Agent externe Dienste ein und reagiert in einem einzigen Prompt auf deren Daten. Eine Montagszusammenfassung kann Zahlen aus Stripe oder GitHub ziehen, sie aufbereiten und das Ergebnis nach Slack oder Linear schreiben, ohne dass sich die Formulierung des Prompts ändert.
Die Stärke liegt dort, wo mitten in der Pipeline Ermessensentscheidungen nötig sind: was markiert werden muss, wie eine Nachricht für einen Kanal formatiert wird, wie mit unerwarteten Daten umzugehen ist. Für strikt deterministische Abläufe mit garantierten Wiederholungen bleiben spezialisierte Workflow Tools die bessere Wahl.
Hermes Agent kann eine Deployment Pipeline übernehmen, vom Abrufen des neuesten Commits über Tests und Staging bis zur Produktion samt Health Check. Der Unterschied zu einem reinen Skript: Erfolgreiche wie fehlgeschlagene Läufe werden zu Skills. Bekannte Sonderfälle löst der Agent beim nächsten Mal ohne Rückfrage.
In regulierten Umgebungen mit signiertem, manipulationssicherem Audit Log bleibt eine dedizierte Plattform die richtige Wahl, denn die Lernschleife ersetzt keine Compliance Tools. Wir bauen belastbare CI und CD Pipelines mit GitLab CI und GitHub Actions und klären projektbezogen, wo ein Agent sinnvoll ergänzt und wo klassische Automatisierung führt.
Mit einem integrierten Scheduler versendet Hermes Agent wiederkehrende Briefings. Du beschreibst Zeitplan und Inhalt in natürlicher Sprache, etwa eine morgendliche Nachricht mit Wetter, Kalender, den wichtigsten Branchennews und offenen Benachrichtigungen. Eine neue Sitzung sammelt die Daten und sendet die Zusammenfassung in den gewählten Kanal.
Dasselbe funktioniert für Wochenreports, monatliche Bereinigungen oder stündliche Systemchecks. Wichtig: Jeder geplante Lauf ruft das Sprachmodell auf, bei hoher Frequenz lohnt ein Ausgabenlimit. Mit lokalen Modellen über Ollama bleibt die Inferenz im eigenen Netz.
Recherche folgt meist demselben Ablauf: Informationen aus mehreren Quellen sammeln, aufbereiten und als Zusammenfassung zurückgeben. Hermes Agent erledigt das in einem Prompt und kann es regelmäßig wiederholen. Weil er Ergebnisse zwischen den Läufen speichert, wird die Recherche kumulativ und hebt nur das Neue gegenüber der Vorwoche hervor.
Sinnvoll ist, im Prompt bestimmte vertrauenswürdige Quellen zu nennen, statt sich auf eine offene Suche zu verlassen. Die Ausgabe ist nur so verlässlich wie die genannten Quellen, und Zusammenfassungen sollten vor dem Handeln am Original geprüft werden. Geeignet ist das Muster auch für Preisbeobachtung oder das Sammeln wissenschaftlicher Arbeiten zu einem Thema.
Viele Automatisierungen vergessen ihren Stand bei einem Neustart. Hermes Agent hält den Zeitplan über eine lokale Statusdatenbank, sodass Jobs auch nach einem Serverneustart weiterlaufen. Verpasste Jobs lassen sich nachholen oder überspringen, und längere Pipelines setzen am letzten Checkpoint fort, statt von vorn zu beginnen.
Ein einfaches Beispiel ist ein Uptime Monitoring, das alle paar Minuten prüft und bei Ausfall benachrichtigt. Der Agent ist dabei vollständig vom Host abhängig, auf dem er läuft. Regelmäßige Backups des Arbeitsverzeichnisses und das Überwachen des Speicherplatzes gehören deshalb fest dazu.
Die größte Stärke entsteht, wenn Memory, Tool Integration, Delegation und Scheduling als eine einzige Routine zusammenarbeiten. Ein wöchentlicher Operations Prompt kann Kalender und Tickets der Vorwoche auswerten, einen Subagenten die Aktivität in den Chatkanälen zusammenfassen lassen und daraus ein Planungsdokument bauen, das per Nachricht zugestellt wird.
Ein einziger Prompt deckt damit alle vorherigen Ebenen ab, ohne separaten Scheduler oder eigenes Skript. Wer dorthin will, startet am besten klein mit einer Routine und ergänzt Ebene für Ebene, wie es das Reifegrad Modell weiter oben zeigt. Die ersten Schritte zeigt unser Leitfaden Vibe Coding anfangen.
Wir betrachten agentenbasierte KI nicht nur theoretisch, sondern nutzen wiederkehrende Routinen selbst entlang unseres gesamten Stacks. Vom Content Marketing über die Entwicklung bis zur Kundenkommunikation laufen Aufgaben als Routinen, die sich an frühere Durchläufe erinnern. Wichtig: Unsere Agenten laufen auf einem lokalen Ollama Stack, nicht auf US Cloud Diensten. Hermes Agent ordnen wir in diesem Feld ein, ohne ihn als einzige Lösung zu verkaufen.
Für jeden Anwendungsfall zeigen wir, was der Bedarf war, warum wir einen Agenten dafür einsetzen und wie es uns konkret hilft:
Jedes dieser Felder haben wir selbst aufgebaut und im Alltag erprobt. Welche Plattform und welche KI Modelle zu einem konkreten Use Case passen, klären wir in der Vibe Coding Beratung ehrlich und projektbezogen.
Nous Research bringt den Kern von Hermes Agent in einem Satz auf den Punkt:
An open-source agent that grows with you.
Nous Research, offizielle Hermes Agent Projektseite, 2026
Genau dieses Mitwachsen über Wochen und Monate unterscheidet einen persistenten Agenten von einem klassischen Assistenten ohne Gedächtnis und ist die Grundlage fast aller hier gezeigten Anwendungsfälle.
In Beratungsprojekten sehen wir regelmäßig dasselbe Muster: Ein Team begeistert sich für einen Agenten, automatisiert zu viel auf einmal und verliert die Kontrolle über das Ergebnis. Der nüchterne Weg funktioniert besser. Eine Routine zuverlässig zum Laufen bringen, dann die nächste Ebene ergänzen. Genau dafür ist das Reifegrad Modell weiter oben gedacht.
Unsere eigene Erfahrung kommt aus dem täglichen Einsatz von Terminal Agenten wie Claude Code und OpenCode, kombiniert mit lokalen Modellen über Ollama. Wir kennen die Stärken und die Grenzen, weil wir beides im Produktivbetrieb erleben. Tools wie Hermes Agent oder Paperclip ordnen wir aus dieser Praxis heraus ein.
Wer agentenbasierte Workflows aufbauen will, profitiert von dieser Erfahrung: bei der Auswahl der KI Modelle, in der laufenden Vibe Coding Beratung, beim Schritt in eine erste eigene Routine oder wenn ein festgefahrenes Projekt eine Rettung braucht.
Roland Golla ist Entwickler aus Leidenschaft – seit über 20 Jahren. Er hat hunderte Projekte begleitet, von Legacy-Refactoring bis KI-Integration. Bei Vibe Coding verbindet er das Beste aus beiden Welten: Die Geschwindigkeit von KI-generiertem Code mit der Qualität professioneller Softwareentwicklung. Kein Bullshit, keine Agentur-Floskeln – direkte Hilfe von jemandem, der selbst täglich im Code steckt.
Die wichtigsten Fragen rund um den praktischen Einsatz von Hermes Agent, kurz und ehrlich beantwortet.
Die häufigsten Einsatzgebiete sind ein persistenter Assistent mit Gedächtnis, automatisierte Content Pipelines, Deployment mit Lerneffekt, geplante Briefings, wiederkehrende Recherche und die Delegation großer Aufgaben an parallele Subagenten. Allen gemeinsam ist, dass die Aufgabe weiterläuft, auch wenn der Chat geschlossen ist.
Ja. Hermes Agent eignet sich gut, um Content in eine mehrstufige Pipeline aus Recherche, Gliederung, Entwurf und Veröffentlichung zu überführen. Ein Stil Skill hält die Texte nah an der eigenen Stimme. Über einen MCP Server lässt sich der Entwurf direkt in ein CMS übertragen, idealerweise als unveröffentlichter Beitrag zur finalen Prüfung.
Hermes Agent kann eine Deployment Pipeline vom Commit bis zum Health Check übernehmen und lernt dabei aus jedem Durchlauf. In regulierten Umgebungen mit signiertem Audit Log bleibt jedoch eine dedizierte CI Plattform die richtige Wahl. Die Lernschleife eines Agenten ersetzt keine Compliance Tools.
Die Software selbst ist Open Source unter MIT Lizenz. Kosten entstehen durch den Server und den genutzten Modell Anbieter, denn jeder geplante Durchlauf ruft das Sprachmodell auf. Bei Jobs mit hoher Frequenz lohnt ein Ausgabenlimit im Anbieter Dashboard. Wer lokale Modelle über Ollama nutzt, hält die Inferenz im eigenen Netzwerk.
Hermes Agent läuft selbst gehostet auf dem eigenen Server, alle Daten bleiben dort. In Kombination mit lokalen Modellen über Ollama verlassen Prompts und Daten das eigene Netzwerk nicht. Wer einen externen Modell Anbieter nutzt, sollte dessen Standort und Vertragslage prüfen. Eine pauschale Aussage ersetzt keine Einzelfallbewertung.
Ein Skript macht jedes Mal exakt das, was geschrieben wurde. Hermes Agent macht das plus das, was er aus früheren Durchläufen in der Umgebung gelernt hat. Erfolgreiche und fehlgeschlagene Läufe werden zu Skills, sodass bekannte Sonderfälle beim nächsten Mal ohne Rückfrage gelöst werden.
Wenn Workflows strikte Reihenfolge, garantierte Wiederholungen oder vollständig deterministische Abläufe brauchen, sind Tools wie Airflow oder Temporal überlegen. Hermes Agent spielt seine Stärke dort aus, wo mitten in der Pipeline Ermessensentscheidungen nötig sind, etwa beim Umgang mit unerwarteten Daten oder beim Formatieren für einen bestimmten Kanal.
Skills sind kurze Markdown Playbooks, die Anleitungswissen speichern. Der Agent schreibt sie nach dem Lösen komplexer Aufgaben und verwendet sie erneut, wenn ähnliche Aufgaben anfallen. Mit jedem gelösten Problem wächst die Skill Bibliothek, und der Agent wird in der konkreten Umgebung zuverlässiger.
Über das Werkzeug delegate task teilt Hermes Agent eine große Aufgabe in parallele Stränge auf. Jeder Subagent arbeitet isoliert und gibt nur eine Zusammenfassung zurück. So bleibt der übergeordnete Agent auf die Orchestrierung fokussiert. Verschiedenen Rollen lassen sich unterschiedlich starke Modelle zuweisen.
Hermes Agent ist über ein einziges Gateway auf vielen Kanälen erreichbar, darunter Telegram, Discord, Slack, WhatsApp, Signal und CLI. Hinzu kommen mehrere Terminal Backends wie lokal, Docker, SSH und isolierte Laufzeitumgebungen. So lässt sich der Agent dort bedienen, wo das Team ohnehin kommuniziert.
Unser eigener Stack basiert auf Terminal Agenten wie Claude Code und OpenCode sowie lokalen Modellen über Ollama. Hermes Agent ordnen wir als Experten ein und beobachten ihn aktiv, setzen ihn aber nicht pauschal in jedem Kundenprojekt produktiv ein. Ob er zu einem Projekt passt, klären wir projektbezogen.
Mit einem einzelnen, überschaubaren Workflow wie einem Morgenbriefing, einer wöchentlichen Recherche oder einem geplanten Servercheck. Sobald eine Routine zuverlässig läuft, kommt die nächste Ebene dazu: Memory, dann MCP Verbindungen, dann Subagenten und Scheduling. Dieser schrittweise Aufbau hält den Einstieg einfach und vorhersehbar.
Wie du mit Open-Source-Tools wie PostHog und GrowthBook plus KI-Coding-Agents professionelles A/B Testing selbst umsetzt - ohne teure SaaS-Loesungen.
Vercels offenes Ökosystem aus modularen Skill Packages für KI Coding Agents wie Claude Code, OpenCode, Cursor und Codex. Mit npx skills CLI, skills.sh Directory und mehr als 18 unterstützten Agenten.
Was ist AGI? Definition, aktueller Stand 2026, die große Debatte ob wir AGI bereits erreicht haben und was das für Entwickler und Unternehmen bedeutet.
Microsofts Open-Source-Framework für Multi-Agent-Systeme – autonome KI-Agenten, die miteinander kommunizieren und komplexe Aufgaben lösen.
Le Chat von Mistral schlägt ChatGPT 2026 in vier Dimensionen: DSGVO und EU AI Act, Geschwindigkeit mit Flash Answers, Preis, Open Source Verfügbarkeit.
OpenAIs ChatGPT im Überblick: Von GPT-5.2 bis GPT-5.4 mit allen Modellen, Features und der Einordnung für Entwickler.
Agent Teams ist das neue Feature in Claude Code: Mehrere KI-Instanzen arbeiten parallel an einem Projekt, koordinieren sich autonom und lösen komplexe Aufgaben schneller als ein einzelner Agent.
Der dezentrale Marktplatz für Claude-Code-Erweiterungen: Plugins finden, installieren und eigene Marketplaces erstellen.
Claude Code Plugins bündeln Slash-Commands, Agents, Hooks und MCP-Server in installierbare Pakete. Mit dezentralen Git-Marketplaces und über 4.600 Community-Repositories ist ein ganzes Ökosystem entstanden.
Claude Code Remote Control, SSH und Cloud Sessions im Vergleich: So arbeiten Entwickler 2026 ortsunabhängig mit dem KI-Coding-Agent von Anthropic.
Was ist Claude Cowork 2026? Der KI-Agent von Anthropic für Desktop-Automatisierung. Funktionen, Anwendungsfälle und Einschränkungen im Überblick.
Claude Design ist Anthropics KI Design Tool mit Opus 4.7. Prototypen, Wireframes und Pitch Decks aus Text, mit direktem Handoff zu Claude Code.
Claude Security scannt Codebases nach Schwachstellen und generiert Patches. Public Beta seit April 2026, powered by Opus 4.7.
Claw Code ist ein quelloffenes KI-Coding-Agent-Framework in Python und Rust. Clean-Room-Rewrite der Claude Code Architektur mit 172k GitHub Stars.
Schritt-für-Schritt Installationsanleitung für den Open-Source KI-Assistenten Clawdbot auf macOS, Linux und Windows mit Provider-Anbindung und Sicherheitskonfiguration.
Mac Mini als Always-on-Server für Clawdbot: Hardware-Empfehlung, macOS-Optimierung, Headless-Betrieb und Sicherheitskonfiguration für das Self-Hosted Setup.
CodeRabbit ist das meistinstallierte KI-Code-Review-Tool auf GitHub mit \u00fcber 2 Mio. verbundenen Repos und 13 Mio. reviewten Pull Requests.
CodexBar zeigt KI-Token-Limits für Claude Code, Cursor und Codex direkt in der macOS Menu Bar. Open Source, MIT-Lizenz, 7.400+ Stars.
ComfyUI ist die leistungsst\u00e4rkste Open-Source-Workflow-Engine f\u00fcr KI-Bildgenerierung. Lokal, DSGVO-konform, unterst\u00fctzt Flux, SDXL, Video und mehr.
Framework für rollenbasierte KI-Agenten-Teams – definiere Rollen, Ziele und Backstories, und lass die Crew autonom zusammenarbeiten.
Cursor BugBot ist Cursors KI-Agent für automatisches Code-Review und Debugging direkt im Editor. Mit über 2 Millionen analysierten Pull Requests pro Monat und einer Resolution Rate von 70 % ist er 2026 ein zentrales Tool im Vibe-Coding-Workflow.
Dify ist die Open Source Plattform für visuelle Agentic AI Workflows und Production grade LLM Apps. NCA bewertet Funktionen, Stärken und Use Cases 2026.
Was ein Digitaler Zwilling ist, wie er sich von Simulation und digitalem Schatten unterscheidet und welche Rolle KI Modelle 2026 dabei spielen.
Open Source Embedding Modelle 2026 für RAG: Qwen3, BGE M3, Nomic, Jina und der Klassiker all MiniLM im strukturierten Vergleich mit Auswahlkriterien.
Überblick über Embodied AI Foundation Models und Vision Language Action Modelle 2026 für Robotik und physische Agenten.
Everything Claude Code (ECC) ist das größte Open Source Skill und Agent Ökosystem für KI Coding Agents. 178.000 GitHub Stars, MIT Lizenz, läuft in Claude Code und OpenCode.
Googles cloudbasierte Entwicklungsumgebung für Full-Stack-Apps mit Gemini-KI: Prototyping per Prompt, App-Deployment per Klick und kostenlos für 3 Workspaces.
Gemini 3.5 Flash schlägt Gemini 3.1 Pro auf agentischen Benchmarks bei einem Drittel des Preises. Verfügbar seit 19. Mai 2026 über Antigravity 2.0 und die Gemini API.
Die Gemini Familie 2026 mit Gemini 3.5 Flash, Gemini Omni Flash, Gemini 3.1 Pro und Deep Think im Vergleich. Benchmarks, Preise und Use Cases.
Gemini Nano ist das kleinste Modell der Gemini Familie, lokal installiert in Chrome und auf Pixel Geräten. Mit DSGVO Bedenken durch Silent Install.
Worktrees gehören Git, nicht Anthropic. Codex, OpenCode, Aider und lokale Modelle parallel nutzen, ganz ohne US Anbieter Bindung 2026.
Git Worktrees isolieren parallele KI Agenten in eigenen Arbeitsverzeichnissen. Native Claude Code Unterstützung, worktreeinclude und Tool Vergleich 2026.
GitBook kombiniert technische Dokumentation mit KI Agent, MCP Server und Git Synchronisation. Überblick für Entwicklerteams und technische Autoren 2026.
GitHub MCP Server verbindet KI Agents direkt mit Repositories, Issues und CI/CD Pipelines. Installation und DSGVO Bewertung 2026.
Google Antigravity 2.0 bringt Desktop App, CLI, SDK und Managed Agents in der Gemini API. Powered by Gemini 3.5 Flash mit zwölffacher Geschwindigkeit.
Gemini Gems erstellen individuelle KI-Assistenten mit Live-Drive-Anbindung, 1M Token Kontext und Team-Sharing – die kostenlose ChatGPT-Custom-GPT-Alternative.
Google Stitch ist das KI-native Design-Tool aus Google Labs: UI per Text oder Sprache generieren, interaktiv prototypen und direkt in HTML/CSS exportieren.
Groq nutzt eigene LPU Chips für extrem schnelle Inferenz von Open Source Modellen wie Llama oder Qwen. Wann lohnt sich der Einsatz, wann ist Ollama oder vLLM die bessere Wahl?
Hermes Agent ist ein selbstlernender Open Source KI Agent von Nous Research mit persistentem Memory, autonomer Skill Erstellung und Multi Plattform Gateway für Telegram, Slack, WhatsApp und Discord.
Hugging Face ist die zentrale Plattform für Open Source KI Modelle mit 2 Millionen Modellen, Datasets, Spaces und Inference Endpoints. NCA Einordnung 2026.
Open Source Framework von HeyGen für lokales Video Rendering. HTML statt React, agent native für Claude Code und Cursor.
Andrej Karpathy ist einer der einflussreichsten LLM-Lehrer weltweit. Sein Wiki, seine GitHub-Projekte und YouTube-Kurse sind Pflichtlektüre für jeden KI-Entwickler.
Moonshot AIs Kimi Modellreihe: Von K2.5 bis K2.6 mit Agent Swarm, 1T MoE Parametern und Ollama Cloud. Alle Features und Benchmarks.
Open Source Framework für LLM Anwendungen mit Chains, Agents und LCEL Pipeline Syntax. Mit LangGraph für Orchestrierung, LangSmith für Evaluation und 1000 Integrationen.
LangChains Framework für zustandsbehaftete KI Workflows: Agenten als Graphen mit definierten Zuständen, Übergängen und Kontrollfluss.
Open Source Bibliothek für lokale LLM Inferenz in C/C++ ohne Abhängigkeiten. GGUF Format, Quantisierung, OpenAI kompatible API.
Open Source RAG Framework von Run-Llama für Indexing, Query Engines und agentenbasierte Document Processing. Im NCA Stack für DSGVO konforme Knowledge Bases mit Ollama.
KI-Modelle direkt auf iPhone und Android ausfuehren: Komplett offline, DSGVO-konform und ohne Cloud. Die besten Apps, Hardware-Anforderungen und Modelle fuer On-Device KI 2026.
LM Studio ist die GUI für lokale LLMs. Features, Ubuntu Installation und wann LM Studio die richtige Wahl ist.
Privacy first, local first, AGPL lizenziert. Logseq ist die DSGVO konforme Antwort auf Notion und Roam Research, mit Ollama Integration für lokale KI Workflows.
Wann DSGVO, Berufsgeheimnis und IP Schutz lokale KI erzwingen — die Szenarien mit Paragraphenbezug für Compliance Pflicht.
Wann sich lokale KI rechnet — Edge, Offline, Mass Processing, CI/CD und Kostenkontrolle als ROI Treiber 2026.
MemPalace ist ein Open Source KI Memory System von Milla Jovovich und Ben Sigman. Es speichert Konversationen lokal mit ChromaDB und SQLite, erreicht 96,6% auf LongMemEval und loest das Problem der KI Amnesie fuer Entwickler und Power User.
Open Source KI Prediction Engine mit GraphRAG und Multi Agent Simulation. Lade Dokumente hoch und simuliere Reaktionen tausender KI Agents.
Mistral AI ist Europas führender KI Anbieter aus Paris. Medium 3.5 mit 256K Kontext, Le Chat mit Work Mode und Vibe CLI Cloud Coding Agents im Überblick.
Mistral Connectors verbinden KI-Agents mit Enterprise-Daten per MCP-Protokoll. Reusable Tool-Integration in Mistral Studio 2026.
Das virale Social Network für KI-Agenten: Funktionsweise, Sicherheitsrisiken und die Debatte um autonome KI-Kommunikation.
Open-Source KI-Assistent mit 60.000+ GitHub Stars, der über WhatsApp, Telegram und andere Messaging-Apps gesteuert wird.
intfloat/multilingual-e5-large ist das stärkste kostenlose Embedding-Modell für RAG und Semantic Search. Self-hosted, MIT-Lizenz, 1024 Dimensionen, kein API-Key nötig.
Nano Banana 2 ist Googles neuester KI-Bildgenerator auf Basis von Gemini 3.1 Flash Image. Pro-Qualität bei Flash-Geschwindigkeit, kostenlos, mit 4K und Real-Time Web Search.
NVIDIA NemoClaw bringt Privacy- und Security-Guardrails zu autonomen KI-Agenten. Deploy mit einem Befehl, lokale Modelle via Nemotron, OpenShell-Controls.
Obsidian ist ein lokales, DSGVO-konformes Markdown-Wissenssystem mit nativer KI-Integration für Claude Code und Vibe Coding Workflows.
Was Odysseus AI kann, warum PewDiePie es so nennt, wie privat es wirklich ist und wann sich der self hosted KI Workspace lohnt. Die NCA Einordnung.
Ollama ist der führende Open-Source-Runner für lokale KI-Modelle. Mit über 150 Modellen, Subagenten-Support und integrierter Websuche macht Ollama KI-gestützte Entwicklung DSGVO-konform und offline-fähig.
Massively multilingual Zero Shot TTS Modell mit Voice Cloning und Voice Design. Apache 2.0, lokal lauffähig, 600 Sprachen Support.
Open WebUI ist eine browserbasierte Oberfläche für lokale KI-Modelle wie Ollama. DSGVO-konform, offline-fähig, erweiterbar durch RAG und Python-Tools – ideal für Entwickler und Unternehmen.
Der dreifach umbenannte KI-Agent – von ClawdBot über MoltBot zu OpenClaw. 100.000+ GitHub Stars, autonome Aufgabenausführung, und erhebliche Sicherheitsbedenken.
Spec-Driven Development Framework für AI Coding Assistants – eine Single Source of Truth für deterministische KI-Entwicklung.
Paperclip verwandelt einzelne KI Agenten in ein koordiniertes Unternehmen. Mit Org Charts, Budgetkontrolle und vollstaendigem Audit Log. Open Source und selbst gehostet.
Paperclip ist die Firma, Hermes Agent der Mitarbeiter mit Memory. Wann nutzt du welche Plattform, wo ergänzen sie sich, was passt zu deinem Stack.
Open Source macOS Automation Toolkit. CLI plus MCP Server für KI Agenten wie Codex, Claude Code und Cursor.
Claude Mythos Preview findet tausende Zero-Day-Schwachstellen in Betriebssystemen und Browsern. Was bedeutet das für Entwickler und DSGVO-konforme KI?
Qwen von Alibaba Cloud ist eine der stärksten Open-Source KI-Modellserien 2026. Qwen3, Qwen3-Coder, QwQ und Qwen3-Omni lokal nutzen – ohne API-Kosten, DSGVO-konform.
Der virale Marktplatz, auf dem KI-Agenten Menschen für reale Aufgaben buchen – per MCP-Call. Funktionsweise, Chancen und Risiken.
Ruflo koordiniert KI-Agenten-Swarms in Claude Code. Open Source, lokal betreibbar und DSGVO-konform. Die Enterprise-Alternative zu Cloud-basierten Agent-Plattformen.
Shannon analysiert Quellcode, findet Angriffsvektoren und f\u00fchrt echte Exploits aus \u2013 bevor sie in Produktion gelangen. Open Source, self-hosted, DSGVO-konform.
Subquadratic launcht SubQ mit Subquadratic Sparse Attention und 12 Millionen Token Context Window. NCA ordnet die Behauptungen und die Skepsis der Forschungs-Community ein.
Das Sylius MCP Server Plugin macht Ihren Onlineshop für KI Agenten zugänglich. Produktsuche, Warenkorb und Checkout per natürlicher Sprache.
Symfony AI Mate verbindet KI Assistenten mit PHP Projekten per Model Context Protocol. Profiler, Logs, Services direkt im KI Workflow.
Canonical bringt mit Ubuntu 26.04 LTS und Ubuntu 26.10 lokale KI Modelle als Inference Snaps direkt ins Betriebssystem.
Unsloth beschleunigt Fine Tuning von LLMs um Faktor 2 bei 70 Prozent weniger VRAM. NCA bewertet LoRA, QLoRA, DoRA und Use Cases für 2026.
Vise Coding ist der strukturierte Gegenansatz zu Vibe Coding: KI erzeugt nur kleine, pr\u00fcfbare \u00c4nderungen mit Tests und Dokumentation f\u00fcr echten Produktionscode.
High Performance LLM Serving mit PagedAttention, Continuous Batching und OpenAI kompatibler API. Ideal für DSGVO konformes Self Hosting.
NCA migrierte den eigenen Chatbot von OpenAI auf Voyage AI voyage-3-m-exp. Erfahrungsbericht: bessere Retrieval Qualität, DSGVO-nähere Kontrolle und konkrete Migrationstipps.
Das Model Context Protocol (MCP) ist der offene Standard f\u00fcr die Verbindung von KI-Agenten mit externen Tools und Datenquellen. Von Anthropic entwickelt, von der Linux Foundation verwaltet.
Alibabas 6B Parameter Bildmodell unter Apache 2.0. Lokal auf 16GB VRAM, 8 Inference Steps, bilinguales Text Rendering.