Ollama – Lokale KI-Modelle für Vibe Coding
Ollama ermöglicht lokale KI-Modelle ohne Cloud. Subagenten, Websuche, Vibe Coding und DSGVO-konform. Alle Features, Modelle und Setup-Tipps 2026.
Mehr erfahren
Unsloth ist eine Open Source Bibliothek für das beschleunigte Fine Tuning großer Sprachmodelle. Sie kombiniert LoRA, QLoRA und DoRA mit eigenen Triton Kerneln und Speicheroptimierungen, sodass das Training von 7B bis 70B Modellen zwei bis fünfmal schneller läuft und bis zu 70 Prozent weniger VRAM benötigt, bei gleichbleibender Modellqualität.
Gegründet wurde Unsloth von den Brüdern Daniel und Michael Han, die zuvor bei NVIDIA an Algorithmus Beschleunigung gearbeitet haben. Heute zählt das Projekt über 40000 GitHub Stars, 10 Millionen monatliche Modell Downloads und arbeitet direkt mit den Teams hinter gpt oss, Qwen3, Llama 4, Mistral, Gemma und Phi 4 zusammen.
Unsloth ist in seinem Kern eine Sammlung optimierter Trainings Kernel plus eine schlanke API. Wer Hugging Face Transformers kennt, findet sich in Unsloth sofort zurecht. Das gespeicherte Ergebnis ist ein LoRA Adapter mit 100 bis 500 Megabyte, der zusammen mit dem Basismodell in Ollama, llama.cpp oder vLLM läuft.
Wir bei NCA beraten Teams, die mit lokalen KI Modellen arbeiten wollen, seit dem Aufstieg von Ollama und llama.cpp. Unsloth gehört dabei zu den Werkzeugen, die wir Kunden empfehlen zu kennen und einzusetzen, wenn die generische Antwort eines Basismodells nicht mehr reicht und domänenspezifisches Wissen ins Modell selbst soll.
Wir helfen euch zu entscheiden, ob Fine Tuning mit Unsloth, ein RAG Setup mit LlamaIndex oder gutes Prompt Engineering die richtige Antwort ist. Begleitend bieten wir Vibe Coding Consulting, lokale KI Stacks, DSGVO konformes Hosting in Deutschland und die Integration der trainierten Modelle in eure PHP und Symfony Backends aus einer Hand.
Finde das passende Angebot für dein Projekt
Hey! Ich bin CodeBot. Lass uns herausfinden, wie wir dein Projekt zum Fliegen bringen.
Was soll entstehen?
Statt alle Modellgewichte zu aktualisieren wie bei klassischem Supervised Fine Tuning, trainiert Unsloth nur winzige Adapter Matrizen, die parallel zum eingefrorenen Basismodell laufen. LoRA optimiert dabei rund ein Prozent der ursprünglichen Parameter, QLoRA quantisiert das Basismodell zusätzlich auf 4 Bit, DoRA zerlegt das Update in Magnitude und Richtung für bessere Konvergenz.
Der praktische Effekt: ein 8B Modell wie Llama 3.1 oder Qwen 3 lässt sich auf einer einzigen RTX 4090 mit 24 Gigabyte VRAM trainieren. Mit QLoRA und Unsloth reicht sogar eine 12 Gigabyte Consumer Karte. Der Trainingslauf dauert je nach Datenmenge zwischen wenigen Stunden und einem Tag. Was früher eine Cluster Infrastruktur erforderte, läuft heute am Schreibtisch.
Unsloth integriert sich nahtlos in das Hugging Face Ökosystem: Modelle werden über die Transformers API geladen, Datasets per Hugging Face Datasets bereitgestellt, das Training läuft über SFTTrainer aus TRL. Nach dem Fine Tuning wird der LoRA Adapter entweder einzeln gespeichert oder in das Basismodell gemergt und als GGUF für Ollama exportiert.
Welche Trainings Methode passt, hängt von Hardware, Datenmenge und Genauigkeitsanspruch ab. Die folgende Übersicht zeigt die vier in Unsloth unterstützten Verfahren und die typischen Anwendungsfälle. Die Balken Infografik im Anschluss zeigt visuell, wie stark jede Methode den VRAM Bedarf gegenüber Full SFT reduziert.
| Methode | Was passiert | VRAM Bedarf |
|---|---|---|
| Full SFT | Alle Modellgewichte werden aktualisiert, höchste Genauigkeit, höchster Aufwand | Sehr hoch: 60 bis 80 GB für ein 8B Modell |
| LoRA | Adapter Matrizen trainieren, Basismodell bleibt eingefroren in 16 Bit | Hoch: rund 24 GB für ein 8B Modell |
| QLoRA | Adapter trainieren plus 4 Bit Quantisierung des Basismodells | Mittel: rund 12 GB für ein 8B Modell |
| DoRA | Adapter Update wird in Magnitude und Richtung zerlegt, beste Konvergenz | Sehr niedrig: rund 10 GB für ein 8B Modell |
Bevor du mit Unsloth ein Modell trainierst, lohnt der ehrliche Vergleich der drei dominanten Wege, ein LLM auf deine Domäne anzupassen. Prompt Engineering ist am schnellsten, aber bei jedem neuen Aufruf bezahlt. RAG mit LlamaIndex ist gut, wenn sich Fakten häufig ändern und nachvollziehbar zitiert werden sollen. Fine Tuning passt, wenn der Stil, die Sprache oder ein spezielles Format eines Modells nachhaltig geprägt werden soll.
Die Methoden schließen sich nicht aus. In Beratungsprojekten kombinieren wir oft alle drei: ein mit Unsloth trainiertes Basismodell, das im Tonfall und Vokabular einer Domäne zu Hause ist, kombiniert mit RAG für aktuelle Fakten und ergänzendem Prompt Engineering pro Use Case. Dieses Layered Setup liefert in der Regel die robustesten Ergebnisse.
Was Fine Tuning nicht ersetzt: aktuelle Faktenrecherche aus Live Quellen oder die nachvollziehbare Quellenangabe in Antworten. Beides ist klassisches RAG Territorium.
Unsloth ist geeignet für Teams, die ein eigenes Modell für eine klar abgegrenzte Aufgabe brauchen: einen Support Bot mit Firmen Tonfall, einen Code Reviewer für die eigene Code Base, ein Modell für Dokumentenklassifikation in einer Branche, einen Stilkopierer für Marketing Texte. Auch für Forschung und für Experimente mit RLHF, DPO oder GRPO ist Unsloth heute Standard.
Unsloth hat Stärken bei Consumer Hardware: ein 7B Modell auf der eigenen Workstation mit RTX 4090 zu trainieren ist heute eine Frage von Stunden, nicht von Wochen. Damit wird Fine Tuning für mittelständische Teams realistisch, ohne Cloud Cluster.
Wir helfen Teams Unsloth einzuordnen, wenn die Datenmenge klein ist und gutes Prompt Engineering reichen würde, wenn die Domäne sich schnell ändert und RAG nachhaltiger wäre, oder wenn der Aufwand für Datenaufbereitung den erwarteten Nutzen übersteigt. Eine ehrliche Bewertung im Vibe Coding Consulting spart oft Wochen vergeblicher Trainingsläufe.
Our open source package uses 70 percent less memory and is twice as fast.
Ollama ermöglicht lokale KI-Modelle ohne Cloud. Subagenten, Websuche, Vibe Coding und DSGVO-konform. Alle Features, Modelle und Setup-Tipps 2026.
Mehr erfahrenWir bei NCA setzen Unsloth nicht in jedem Production Stack ein, sondern empfehlen es gezielt dort, wo Fine Tuning die richtige Antwort ist. In Beratungsprojekten haben wir mit Unsloth Modelle für Customer Support, Code Generation und Dokumentenanalyse trainiert. Die größte Lektion: gute Datenqualität schlägt jede Hyperparameter Tunerei.
Was uns an Unsloth überzeugt: die Geschwindigkeit, mit der ein erster sinnvoller Adapter entsteht. Was wir kritisch begleiten: die Versuchung, Fine Tuning als Allheilmittel zu sehen. Oft ist ein gutes Embedding Modell für RAG die ehrlichere Lösung als ein neues Fine Tuning.
Das fertige Modell läuft bei uns in Production über Ollama oder vLLM, default direkt auf eigener Hardware, bei Bedarf gehostete Inferenz über unseren Partner Conversis in Duisburg. Diese Kette aus Training mit Unsloth und Production mit eigenem Hosting macht den Unterschied zwischen Demo und nachhaltigem Setup.
Roland Golla ist Entwickler aus Leidenschaft – seit über 20 Jahren. Er hat hunderte Projekte begleitet, von Legacy-Refactoring bis KI-Integration. Bei Vibe Coding verbindet er das Beste aus beiden Welten: Die Geschwindigkeit von KI-generiertem Code mit der Qualität professioneller Softwareentwicklung. Kein Bullshit, keine Agentur-Floskeln – direkte Hilfe von jemandem, der selbst täglich im Code steckt.
Die Fragen, die uns in Beratungsprojekten zu Unsloth und Fine Tuning am häufigsten gestellt werden.
Unsloth Core ist Open Source und kostenlos unter Apache 2.0 Lizenz. Es entstehen keine Lizenzkosten, lediglich die GPU Stromkosten oder Cloud GPU Stunden während des Trainings. Für Teams ohne eigene GPU bietet Unsloth kostenlose Notebooks auf Google Colab und Kaggle, die ein 8B Modell auf einer T4 GPU trainieren können.
Für QLoRA Fine Tuning eines 8B Modells reicht eine Consumer GPU mit 12 Gigabyte VRAM, also eine RTX 3060 oder besser. Für LoRA in 16 Bit ohne Quantisierung empfehlen wir 24 Gigabyte VRAM wie auf einer RTX 4090. Auf einer NVIDIA DGX Spark oder einer A100 lassen sich auch 70B Modelle trainieren.
Unsloth ist die schnellste Option auf einer einzelnen Consumer GPU. Axolotl ist YAML konfigurierbar und passt für Teams, die viele Experimente vergleichen wollen. LLaMA Factory liefert ein UI plus breite Modellunterstützung. Für die meisten Beratungsprojekte starten wir mit Unsloth und wechseln nur, wenn der Use Case es verlangt.
LoRA trainiert kleine Adapter Matrizen parallel zum eingefrorenen 16 Bit Basismodell. QLoRA quantisiert das Basismodell zusätzlich auf 4 Bit, sodass es weniger VRAM braucht. Die Trainingsqualität liegt bei QLoRA fast gleichauf, der Speicherbedarf sinkt auf rund die Hälfte gegenüber LoRA. Für Consumer Hardware fast immer die richtige Wahl.
Ja, Unsloth unterstützt über 500 Modelle inklusive DeepSeek V3 und V4, Qwen 3 und Qwen 3.5, Llama 4, Mistral, Gemma und Phi 4. Das Team arbeitet direkt mit den Model Maintainern zusammen und hat mehrfach kritische Bugs in den Originalimplementierungen gefunden und gefixt, die die Modellqualität verbessert haben.
Der LoRA Adapter wird entweder einzeln gespeichert oder per save_pretrained_merged in das Basismodell gemergt. Anschließend lässt sich das Modell in GGUF konvertieren und mit Ollama oder llama.cpp lokal laufen lassen. Für High Throughput Production empfehlen wir vLLM mit dem gemergten Modell oder direkt dem Adapter.
Klassisches Format sind Frage Antwort Paare oder Instruction Datasets im Alpaca oder ShareGPT Format. Unsloth bringt ein Synthetic Dataset Notebook mit, das aus PDFs oder Videos automatisch QA Paare generiert. In der Praxis schlägt eine gut kuratierte Sammlung von 500 bis 5000 Beispielen oft eine quantitativ größere aber unsaubere Sammlung.
Ja, Unsloth unterstützt GRPO, DPO und klassisches PPO Training mit 80 Prozent weniger VRAM als Standard Implementierungen. Für RLHF Pipelines, RL aus echten Nutzerdaten oder Reasoning Training mit Reward Modellen ist Unsloth heute die effizienteste Open Source Option.
Für ein 8B Modell mit 1000 Beispielen und 3 Epochen auf einer RTX 4090 rechne mit 2 bis 4 Stunden. Auf einer A100 sinkt das auf eine Stunde. Größere Datenmengen oder Modelle skalieren linear. Pro Trainingslauf empfehlen wir mindestens einen Validierungslauf mit eigenem Eval Set vor dem Deployment.
Drei Schichten: erstens task spezifische Metriken auf einem Hold out Set, zweitens ein MMLU Delta Check gegen das Basismodell, drittens manuelle Side by Side Vergleiche mit identischen Prompts. Wenn das fine getunte Modell nur marginal besser ist als das Basismodell mit gutem Prompting, war das Fine Tuning den Aufwand nicht wert.
Fine Tuning lohnt, wenn es um Stil, Tonalität, Format oder Spezialvokabular geht, die das Modell nachhaltig lernen soll. RAG ist besser, wenn sich die Fakten häufig ändern oder Quellenangaben zwingend sind. In Beratungsprojekten kombinieren wir oft beides für maximale Robustheit.
Drei Hauptrisiken: erstens Overfitting bei zu wenig oder zu eintönigen Daten, zweitens Catastrophic Forgetting wo das Modell allgemeine Fähigkeiten verliert, drittens versteckte Bias Probleme aus Trainingsdaten. Validierung gegen MMLU und manuelles Testen mit Edge Cases sind Pflicht vor jedem Production Deployment.
A/B Testing mit KI-Coding-Agents und PostHog oder GrowthBook: So setzt du automatisiertes Testing mit Vibe Coding um - DSGVO-konform und Open Source.
Agent Skills 2026: Vercels Ökosystem für KI Coding Agents. Modulare Skill Packages für Claude Code, OpenCode, Cursor und 18 weitere Agents. Mit npx skills CLI.
AGI (Artificial General Intelligence) bezeichnet KI-Systeme mit menschenähnlicher Intelligenz. Definition, aktueller Stand, Kontroversen und was AGI für Entwickler bedeutet.
AutoGen ist Microsofts Open-Source-Framework für Multi-Agent-Systeme. Mehrere KI-Agenten arbeiten autonom zusammen und lösen komplexe Aufgaben durch Konversation.
ChatGPT und die GPT-5-Serie: GPT-5.2, 5.3 Instant und 5.4 mit Features, Benchmarks und Einordnung für Entwickler 2026.
Claude Agent Teams ermöglicht parallele KI-Agenten in Claude Code. Aktivierung, Setup, Anwendungsfälle und Best Practices für Entwickler 2026.
Der Claude Code Plugin Marketplace ist ein dezentrales, Git-basiertes System für KI-Entwickler-Plugins. So finden, installieren und erstellen Sie eigene Marketplaces 2026.
Claude Code Plugins bündeln Slash-Commands, Agents, Hooks und MCP-Server in teilbare Pakete. So erweitern Entwickler ihr KI-Coding-Tool 2026.
Claude Code Remote Control, SSH-Zugriff und Cloud Sessions: So steuern Sie Ihre KI-Coding-Sessions von unterwegs. Setup, Sicherheit und Vergleich 2026.
Was ist Claude Cowork 2026? Der KI-Agent von Anthropic für Desktop-Automatisierung. Funktionen, Anwendungsfälle und Einschränkungen im Überblick.
Claude Design ist Anthropics KI Design Tool auf Opus 4.7 Basis. Prototypen, Wireframes und Pitch Decks aus Text, Handoff zu Claude Code.
Claude Security ist Anthropics Vulnerability Scanner in Public Beta auf Opus 4.7. Was er kann, wer ihn nutzen darf und wie er funktioniert.
Claw Code ist ein quelloffenes KI-Coding-Agent-Framework in Python und Rust. Clean-Room-Rewrite der Claude Code Architektur. 172k GitHub Stars. Jetzt mehr erfahren.
Clawdbot installieren: Komplette Anleitung für macOS, Linux und Windows (WSL2). Node.js Setup, Provider-Anbindung, Sicherheitskonfiguration und Best Practices für den Always-on-Betrieb.
Clawdbot auf Mac Mini einrichten: Komplette Anleitung für den Always-on KI-Assistenten. Hardware-Auswahl, macOS Headless-Konfiguration, Energy Saver, SSH-Zugang, Docker-Isolation und Best Practices 2026.
CodeRabbit reviewt Pull Requests automatisch mit KI und 40+ Lintern. So nutzen PHP-Teams das Tool DSGVO-konform in CI/CD-Pipelines.
CodexBar zeigt Token-Limits für Claude Code, Cursor und Codex direkt im macOS Menu Bar. Kostenlos, MIT-lizenziert, 7.400+ GitHub Stars.
ComfyUI ist eine Open-Source-Engine f\u00fcr KI-Bildgenerierung mit node-basiertem Workflow-Editor. Lokal, DSGVO-konform, unterst\u00fctzt Flux, SDXL und mehr.
CrewAI ist ein Framework für rollenbasierte Multi-Agent-Systeme. Definiere Agenten mit Rollen, Zielen und Backstories – sie arbeiten autonom als Team zusammen.
Cursor BugBot ist der KI-Debugging-Agent für Vibe Coding. Über 2 Mio. PRs/Monat, 70 % Resolution Rate. Wie er funktioniert und wann er hilft.
Dify ist die Open Source Plattform für visuelle Agentic AI Workflows, RAG Pipelines und Production grade LLM Apps. NCA Einordnung und Use Cases 2026.
Open Source Embedding Modelle 2026 für RAG im Überblick: Qwen3, BGE M3, Nomic, Jina, all MiniLM und multilingual e5 mit Auswahlkriterien für lokale Inferenz.
Embodied AI und Vision Language Action Modelle 2026: HY-Embodied-0.5, Pi Zero, NORA, OpenVLA, Gemini Robotics. KI Foundation Models für Roboter im Vergleich.
Everything Claude Code (ECC) bündelt 182 Skills, 48 Agents und AgentShield für Claude Code, OpenCode und Codex. NCA ordnet das System ein
Firebase Studio ist Googles cloudbasierte KI-Entwicklungsumgebung für Full-Stack-Apps. Prototyping per Prompt, Gemini-KI, kostenlos nutzbar. NCA Glossar 2026.
Googles Gemini 3 Familie umfasst Pro, Flash, Flash Lite und Deep Think. ARC AGI 2 Benchmarks, 1M Context Window und Use Cases im Vergleich 2026.
Gemini Nano ist Googles On Device LLM in Chrome und Pixel. 4 GB Silent Install, DSGVO Risiken, Built in AI APIs und lokale Alternativen 2026.
GitBook ist die KI gestützte Dokumentationsplattform mit Git Workflows, MCP Server und Agent. Funktionen, Preise und DSGVO Bewertung für Entwicklerteams.
GitHub MCP Server verbindet KI Agents direkt mit Repositories, Issues und CI/CD Pipelines. Installation und DSGVO Bewertung für Entwickler 2026.
Google Antigravity 2026: Die revolutionäre Agent-First IDE mit autonomen KI-Agenten. Powered by Gemini 3 Pro. Kostenlos für Entwickler. Installation, Features und Vergleich.
Google Gemini Gems sind anpassbare KI-Assistenten mit 1-Million-Token-Kontext und Live-Google-Drive-Sync. Vergleich mit ChatGPT Custom GPTs.
Google Stitch: KI-natives Vibe Design Tool – UI aus Text und Sprache generieren, prototypen und direkt in Code exportieren. Kostenlos in Google Labs.
Groq AI im Test 2026: LPU Hardware, Geschwindigkeit, DSGVO Bewertung und wann sich Groq für deutsche Unternehmen lohnt.
Hermes Agent von Nous Research: selbstlernender Open Source KI Agent mit Memory, Skills System und MCP. Installation, Vergleich und DSGVO Bewertung.
Hugging Face ist die zentrale Plattform für Open Source KI Modelle mit 2 Millionen Modellen, Datasets, Spaces und Endpoints. NCA Einordnung 2026.
Hyperframes rendert HTML zu MP4 lokal. Apache 2.0 Framework für KI Agents mit Claude Code, Cursor und Codex. Datenschutz, Reproduzierbarkeit, keine Cloud.
Das Karpathy LLM Wiki erklärt Andrej Karpathys wichtigste LLM-Ressourcen für Entwickler: nanoGPT, LLM.c, makemore und das LLM OS Konzept kompakt erklärt.
Kimi von Moonshot AI: MoE Modell mit 1T Parametern, Agent Swarm, Ollama Cloud und 256K Kontext. K2.5 und K2.6 Features, Benchmarks und Einsatz.
LangChain Open Source Framework für LLM Anwendungen 2026: LCEL Pipelines, Agents, LangGraph Integration, LangSmith Evaluation. Beratung von NCA für DSGVO konforme Setups.
LangGraph ist LangChains Framework für Multi Agent Workflows. Graphen definieren Kontrollfluss, Zyklen und Entscheidungslogik für Production KI Systeme.
llama.cpp ermöglicht lokale KI Inferenz ohne Cloud Abhängigkeit. GGUF Modelle, OpenAI API, Quantisierung und DSGVO konformer Betrieb im Überblick.
LlamaIndex Open Source RAG Framework für Document Agents 2026: Indexing, Retrieval, agentic Workflows. Mit Ollama im DSGVO konformen NCA Stack. Beratung von Experten.
LLM lokal auf dem Smartphone nutzen: Die besten Apps fuer Android und iOS, Hardware Anforderungen und DSGVO Vorteile von On Device KI 2026.
LM Studio bringt lokale KI Modelle in eine Desktop App. GGUF, MLX, MCP Host, OpenAI API. NCA zeigt Features, Ubuntu Installation und Einordnung.
Logseq ist das privacy first Open Source Wissensmanagement Tool. Local first, DSGVO konform und ideal für KI Workflows mit Ollama oder eigenen Modellen.
MemPalace von Milla Jovovich ist das Open Source KI Memory System gegen KI Amnesie. 96,6% LongMemEval, lokal, DSGVO konform. NCA erklaert Setup und Einsatz.
Mirofish ist eine Open Source KI Prediction Engine mit Multi Agent Simulation. Was sie kann, wie sie funktioniert und wie NCA dabei berät.
Mistral AI 2026: Medium 3.5 mit 256K Kontext, Le Chat Work Mode, Vibe CLI Cloud Agents und Connectors. Europäische KI mit echter Datensouveränität.
Mistral Connectors verbinden KI-Agents mit Enterprise-Daten per MCP-Protokoll. So funktioniert reusable Tool-Integration in Mistral Studio 2026.
Was ist Moltbook? Das virale Social Network für KI-Agenten – Funktionsweise, Sicherheitslücken und warum Experten davor warnen. Alles Wichtige kompakt erklärt.
MoltBot heißt mittlerweile OpenClaw und hat über 247.000 GitHub Stars. Der virale Open Source KI Agent im Überblick: Funktionen, Versionen, Sicherheit.
intfloat/multilingual-e5-large auf HuggingFace: MIT-lizenziertes Embedding-Modell für 100 Sprachen. Self-hosted, kostenlos, DSGVO-konform. Vergleich mit voyage-3-m-exp 2026.
Nano Banana 2 (Gemini 3.1 Flash Image): Googles schnellster KI-Bildgenerator mit 4K, Text-Rendering und Web-Grounding. Jetzt kostenlos verfügbar.
NVIDIA NemoClaw erweitert OpenClaw um Privacy- und Security-Controls. Lokale KI-Modelle via Nemotron, OpenShell-Guardrails, Deploy mit einem Befehl.
Obsidian mit KI und künstlicher Intelligenz: lokales PKM-Tool, DSGVO-konform, Obsidian Skills auf GitHub für Claude Code. NCA erklärt den Setup.
Ollama ermöglicht lokale KI-Modelle ohne Cloud. Subagenten, Websuche, Vibe Coding und DSGVO-konform. Alle Features, Modelle und Setup-Tipps 2026.
OmniVoice ist das Zero Shot TTS Modell von k2-fsa mit 600 Sprachen Support. Voice Cloning, Voice Design, Apache 2.0, lokal lauffähig.
Open WebUI ist das führende Self-Hosted Interface für lokale KI-Modelle. DSGVO-konform, Docker-Setup, RAG, Multimodell – so richtest du es 2026 ein.
OpenClaw ist ein autonomer KI-Agent mit 100.000+ GitHub Stars. Ursprünglich ClawdBot, dann MoltBot – jetzt OpenClaw. Messaging-Integration, Skills-System und Sicherheitsrisiken erklärt.
OpenSpec ist ein leichtgewichtiges Framework für Spec-Driven Development mit KI-Coding-Assistenten. Single Source of Truth für Claude Code, Cursor und Copilot.
Paperclip ist die Open Source Plattform fuer KI Agenten Teams 2026. Mit Org Charts, Budgetkontrolle und Audit Log. Selbst gehostet und DSGVO konform.
Paperclip orchestriert KI Agent Teams, Hermes Agent lernt persistent dazu. Vergleich der Open Source Plattformen aus 2026 mit Use Cases und Stack
Peekaboo automatisiert macOS für KI Agenten. CLI plus MCP Server, Screen Capture, Click und Type, aus dem openclaw Ökosystem von Peter Steinberger.
Project Glasswing ist Anthropics Initiative, mit Claude Mythos Preview Zero-Day-Schwachstellen in kritischer Software zu finden. Was steckt dahinter?
Qwen ist Alibabas Open-Source KI-Modellfamilie mit Qwen3, Qwen3-Coder und Qwen3-Omni. Apache 2.0, lokal nutzbar, DSGVO-freundlich.
RentAHuman.ai ist der Marktplatz, auf dem KI-Agenten Menschen für physische Aufgaben buchen. Funktionsweise, MCP-Integration, Risiken und Chancen 2026.
Ruflo ist die führende Agent-Orchestrierungsplattform für Claude Code. Multi-Agent-Swarms, 60+ Agenten, WASM-Embeddings, lokal oder On-Premise einsetzbar.
Shannon ist ein autonomer KI-Pentester f\u00fcr Web-Apps und APIs. White-Box-Analyse, echte Exploits, DSGVO-konform on-premise einsetzbar. NCA-Beratung.
SubQ ist der erste fully sub-quadratische LLM mit 12 Millionen Token Context Window. NCA ordnet Architektur, Benchmarks und Skepsis der Forschungs-Community ein.
Sylius MCP Server Plugin verbindet KI Agenten mit Ihrem Onlineshop. Produktsuche, Checkout und Bestellungen per Conversational Commerce.
Symfony AI Mate ist ein MCP Server für KI gestützte PHP Entwicklung. Installation, Extensions, Claude Code Integration und Vibe Coding mit Symfony.
Ubuntu 26.04 LTS bringt lokale KI mit Inference Snaps für Qwen, DeepSeek und Gemma. Ubuntu 26.10 startet Opt in Preview im Oktober 2026.
Vibe Coding macht Schulden. Vise Coding l\u00f6st das. NCA Experten erkl\u00e4ren, wie AI Code mit Guardrails, Tests und Doku echten Produktionscode liefert. Jetzt beraten lassen.
vLLM ist die Open Source Inference Engine für produktives LLM Serving: PagedAttention, bis zu 24x Throughput, DSGVO konformes Self Hosting. Jetzt erklärt.
Wie NCA OpenAI Embeddings durch Voyage AI voyage-3-m-exp auf HuggingFace ersetzte. Erfahrungsbericht, Benchmarks und Migrationsanleitung 2026.
Web MCP verbindet KI-Agenten \u00fcber Streamable HTTP mit externen Tools und Datenquellen. Alles \u00fcber Remote MCP Server, Sicherheit und Einsatz 2026.
Alibabas Z Image Turbo: 6B Parameter Open Source Bildgenerator unter Apache 2.0. Lokal auf 16GB VRAM. Editorial Einordnung von NCA.