Gemini Familie 2026: 3.5 Flash Omni 3.1 Pro Deep Think
Die Gemini Familie 2026 umfasst Gemini 3.5 Flash, Gemini Omni, Gemini 3.1 Pro und Deep Think. Benchmarks, Preise und Vibe Coding Use Cases im Vergleich.
Mehr erfahren
Gemini Nano ist das kleinste Modell der Gemini Familie von Google. Anders als Gemini 3 Pro oder Flash läuft Gemini Nano direkt auf dem Endgerät. Das Modell wird im Chrome Browser und auf Pixel Smartphones lokal installiert und arbeitet ohne Cloud Verbindung. Mit rund 4 GB Größe sitzt es als weights.bin Datei im Ordner OptGuideOnDeviceModel und wird über die TFLite Engine und Googles MediaPipe Stack ausgeführt.
Gemini Nano powert in Chrome verschiedene KI Funktionen: Help me write in Textfeldern, Page Summaries, Tab Group Suggestions, Smart Paste und On Device Scam Detection. Auf Pixel Geräten kommt das Modell unter anderem für Recorder Zusammenfassungen und intelligente Antworten in Messaging Apps zum Einsatz. Für Webentwickler bietet Chrome ab Version 138 die Built in AI APIs Prompt, Translator, Summarizer, Writer und Rewriter.
Im Mai 2026 steht Gemini Nano im Zentrum einer Datenschutz Debatte. Privacy Forscher und Medien wie The Register, TechRadar und Quartz dokumentieren, dass Chrome das 4 GB Modell ohne explizite Nutzer Zustimmung auf Geräte herunterlädt und nach Löschung automatisch wiederherstellt. Computer Scientist Alexander Hanff argumentiert, dass diese Praxis gegen Article 5 Absatz 3 der ePrivacy Directive verstößt.
NCA berät Teams seit Jahren beim Aufbau DSGVO konformer Stacks und beim Umgang mit On Device KI. Wir kennen die technische Funktionsweise von Gemini Nano, die rechtlichen Implikationen unter ePrivacy Directive und DSGVO sowie die Migrations Pfade hin zu europäischen Alternativen. Im NCA Production Stack laufen lokale Modelle über Ollama mit Qwen und Llama auf eigenen Servern in Deutschland.
Wir helfen Teams bei der Einordnung von Gemini Nano im eigenen Setup. Dazu zählen unsere Leistungen rund um lokale KI mit Ollama, die Migration zu llama.cpp basierten Setups, der Aufbau eines DSGVO freundlichen KI Tool Stacks, die Vibe Coding Beratung für Teams, die Gemini Nano als Frontend Baustein erwägen, und die Integration von On Device LLMs auf dem Smartphone.
Finde das passende Angebot für dein Projekt
Hey! Ich bin CodeBot. Lass uns herausfinden, wie wir dein Projekt zum Fliegen bringen.
Was soll entstehen?
Gemini Nano läuft an drei Stellen. Erstens im Chrome Browser ab Version 138 auf Desktop Plattformen Windows, macOS und Linux. Zweitens auf Pixel Smartphones ab Pixel 8 Pro, Pixel 9 und Pixel 10 als Teil des Android Betriebssystems. Drittens optional auf neueren Android Geräten über die AICore Komponente, sofern der Hersteller diese ausliefert.
Das Modell wird in mehreren Größenstufen ausgeliefert. Auf Desktop Chrome ist die Datei rund 4 GB groß. Auf Pixel Smartphones läuft eine kleinere quantisierte Variante mit etwa 1 bis 2 GB. Die exakte Größe hängt vom Gerät, der RAM Ausstattung und der Build Variante ab. Mehrere Versions Verzeichnisse können sich addieren, wenn Chrome alte Modellversionen nicht zuverlässig aufräumt.
Wer Datenschutz priorisiert, sollte einen DSGVO freundlicheren Browser wie Brave oder Vivaldi in Betracht ziehen. Wir empfehlen unseren Kunden bei NCA grundsätzlich europäische Alternativen, wo möglich. Für lokale KI ohne Tracking ist Ollama mit Qwen oder Llama eine ausgereifte Lösung.
Für Webentwickler ist Gemini Nano über die Built in AI APIs in Chrome zugänglich. Diese JavaScript Schnittstellen erlauben es, KI Funktionen direkt im Browser auszuführen, ohne Cloud Anbindung. Aktuell sind fünf APIs in unterschiedlichen Verfügbarkeitsstadien: Prompt API, Translator API, Summarizer API, Writer API und Rewriter API. Sie laufen im Origin Trial Modell und werden Schritt für Schritt zu stabilen Web Standards.
Ein einfacher Prompt API Aufruf sieht so aus: erst die Verfügbarkeit prüfen, dann eine Session erstellen und einen Prompt schicken. Die Antwort kommt direkt aus dem lokalen Modell, ohne Netzwerk Aufruf. Diese Eigenschaft ist für Privacy First Anwendungen interessant, etwa für Notiz Apps, Schreibhilfen und Übersetzer in regulierten Branchen.
// Built in AI Prompt API in Chrome
const availability = await ai.languageModel.availability();
if (availability === 'available') {
const session = await ai.languageModel.create({
initialPrompts: [
{ role: 'system', content: 'You are a friendly assistant.' }
]
});
const result = await session.prompt('Was ist Vibe Coding?');
console.log(result);
session.destroy();
}
Die APIs sind aktuell in Chrome als Origin Trial verfügbar. Wer für eigene Webseiten experimentieren will, kann sich im Chrome Origin Trial Programm anmelden oder per Flag freischalten. Achtung: bestehende Webseiten können auf das lokale Modell zugreifen, sobald der Nutzer die API freigibt. Die Eingabe und Ausgabe sind dann unter der Datenschutzerklärung der jeweiligen Webseite zu betrachten.
Anfang Mai 2026 dokumentiert Privacy Forscher Alexander Hanff, dass Chrome das 4 GB Gemini Nano Modell ohne explizite Nutzer Zustimmung auf eligible Geräte herunterlädt. Die Datei landet im Verzeichnis OptGuideOnDeviceModel, ein generischer Name, der für Endnutzer kaum als Gemini Nano erkennbar ist. Wird die Datei manuell gelöscht, lädt Chrome sie automatisch wieder herunter.
Hanffs juristische Argumentation: Article 5 Absatz 3 der ePrivacy Directive verbietet das Speichern von Informationen auf Endgeräten ohne vorherige, freie, spezifische, informierte und unmissverständliche Zustimmung. Die 4 GB Modell Datei sei eine solche Information, die Bedingungen der Ausnahme nicht erfüllt, da Chrome auch ohne Datei voll funktioniert. Hanff schätzt die durch die Verteilung verursachten CO2 Äquivalent Emissionen weltweit auf 6.000 bis 60.000 Tonnen pro einmaligem Modell Push.
Eine zweite Kritik betrifft die AI Mode Deception in der Chrome Adresszeile. Das prominente AI Mode Pill suggeriert lokale Verarbeitung, obwohl jede Anfrage an Googles Server geschickt wird. Das lokale Gemini Nano powert nur Funktionen tief in Kontextmenüs, die kaum jemand findet. Google hat im April 2026 die Privacy Hinweise zu On Device AI angepasst, um Konflikte mit Datenschutz Aussagen zu vermeiden.
Google Chrome is reaching into users' machines and writing a 4 GB on-device AI model file to disk without asking. The file is named weights.bin. It lives in OptGuideOnDeviceModel. Chrome did not ask. Chrome does not surface it. If the user deletes it, Chrome re-downloads it.
Gemini Nano ist nicht das einzige On Device LLM 2026. Wer sich für lokale KI interessiert, hat mehrere Optionen. Ollama mit Qwen oder Llama ist die etablierte Open Source Lösung für Desktop und Server. Die Modelle sind unter Apache 2.0 oder MIT Lizenz verfügbar, der User entscheidet selbst über Installation und Updates. Apple bietet auf eigenen Geräten Foundation Models über das macOS und iOS SDK, mit klarer Privacy Architektur.
Im direkten Vergleich punktet Gemini Nano mit nahtloser Browser Integration und sofortiger Verfügbarkeit über die Built in AI APIs. Schwächen sind die intransparente Installation, die fehlende Wahlfreiheit und die Bindung an das Chrome Ökosystem. Ollama bietet maximale Kontrolle, braucht aber initiales Setup und in der Regel mehr RAM. Apple Foundation Models sind die beste Wahl im Apple Ökosystem, aber nicht plattformübergreifend.
Eine vierte Variante ist LLM lokal auf dem Smartphone über Apps wie LLM Farm oder MLC Chat. Diese Apps lassen Open Source Modelle direkt auf iOS oder Android laufen, ohne Cloud Backend. Wer Gemini Nano umgehen will, aber auf On Device KI nicht verzichten möchte, fährt mit dieser Kombination am besten.
Wer Gemini Nano nicht auf dem eigenen Rechner haben möchte, kann es seit Februar 2026 in Chrome direkt abschalten. Google hat nach Druck der Datenschutz Community ein Toggle in den Chrome Einstellungen ergänzt. Zusätzlich lässt sich das Modell über Chrome Flags blockieren. Wer prüfen will, ob Chrome bereits ein Modell installiert hat, kann das mit einem einfachen Terminal Befehl tun.
# macOS: prüfen ob Chrome Gemini Nano installiert hat
du -sh ~/Library/Application\ Support/Google/Chrome/Default/OptGuideOnDeviceModel/
# Linux: gleiche Prüfung
du -sh ~/.config/google-chrome/Default/OptGuideOnDeviceModel/
# Windows: PowerShell
Get-ChildItem -Path "$env:LOCALAPPDATA\Google\Chrome\User Data\Default\OptGuideOnDeviceModel" -Recurse | Measure-Object -Property Length -Sum
Wenn ein Verzeichnis mit etwa 4 GB Daten erscheint, ist Gemini Nano installiert. Das Verzeichnis kann gelöscht werden, allerdings lädt Chrome es bei aktiven AI Features automatisch wieder herunter. Wer das verhindern will, deaktiviert in den Chrome Einstellungen unter Datenschutz und Sicherheit den Punkt On Device AI.
Alternativ ist der Wechsel zu einem Browser ohne Built in AI eine saubere Lösung. Brave und Vivaldi bieten Privacy First Eigenschaften ohne automatische KI Modell Downloads. Beide Browser laufen auf dem Chromium Unterbau, sind also zu Chrome Extensions kompatibel.
Bei NCA setzen wir Gemini Nano nicht in unserer eigenen Production ein. Unser lokaler KI Stack basiert auf Ollama mit Qwen und Llama Modellen, die auf eigenen Servern in Deutschland mit Conversis Duisburg laufen. Diese Architektur bietet uns volle Kontrolle über Modell Versionen, Datenhaltung und Update Zyklen. Browser seitig empfehlen wir Brave oder Vivaldi für Endnutzer und Kundenteams.
Wir kennen Gemini Nano editorial und ordnen es für Beratungskunden ein. Die Browser Integration ist technisch beeindruckend und die Built in AI APIs sind ein interessanter Schritt in Richtung Web Standards. Gleichzeitig sehen wir die Datenschutz Risiken kritisch: die intransparente Installation, die fehlende Opt In Logik und die Bindung an Googles Browser Ökosystem widersprechen unserem Verständnis von User Sovereignty.
Wer mit Gemini Nano experimentieren möchte, sollte das in einem isolierten Test Setup tun, etwa in einem dedizierten Chrome Profil oder einer VM. Für Production empfehlen wir den Pfad über Ollama mit Open Source Modellen oder einen hybriden Stack mit Gemini 3 Flash für Cloud Use Cases und Ollama für lokale Tasks.
Roland Golla ist Entwickler aus Leidenschaft – seit über 20 Jahren. Er hat hunderte Projekte begleitet, von Legacy-Refactoring bis KI-Integration. Bei Vibe Coding verbindet er das Beste aus beiden Welten: Die Geschwindigkeit von KI-generiertem Code mit der Qualität professioneller Softwareentwicklung. Kein Bullshit, keine Agentur-Floskeln – direkte Hilfe von jemandem, der selbst täglich im Code steckt.
Wir sammeln hier die Fragen zu Gemini Nano, die uns aus der Beratungspraxis und aus der Datenschutz Debatte im Mai 2026 begegnen.
Gemini Nano ist Googles kleinstes Modell der Gemini Familie. Es läuft als On Device LLM lokal auf Chrome im Desktop und auf Pixel Smartphones. Mit rund 4 GB Größe powert es Funktionen wie Help me write, Page Summaries, Smart Paste und Scam Detection ohne Cloud Verbindung.
Auf Desktop Chrome ist Gemini Nano rund 4 GB groß. Auf Pixel Smartphones läuft eine kleinere quantisierte Variante mit 1 bis 2 GB. Mehrere Versions Verzeichnisse können sich addieren, wenn Chrome alte Modellversionen nicht aufräumt. Manche Nutzer berichten von 12 GB und mehr Gesamtgröße.
Chrome speichert Gemini Nano im Verzeichnis OptGuideOnDeviceModel innerhalb des Chrome Default Profil Ordners. Die Hauptdatei heißt weights.bin und enthält die Modellgewichte. Der generische Verzeichnisname macht es schwer, die Datei eindeutig als Gemini Nano zu erkennen.
Privacy Forscher Alexander Hanff argumentiert, dass die ungefragte Installation gegen Article 5 Absatz 3 der ePrivacy Directive verstößt. Eine endgültige juristische Klärung steht aus. Google hat im Februar 2026 eine Opt Out Option in den Chrome Einstellungen ergänzt und im April 2026 die Privacy Hinweise angepasst.
In den Chrome Einstellungen unter Datenschutz und Sicherheit findest du seit Februar 2026 einen Toggle für On Device AI. Wenn du ihn deaktivierst, deinstalliert Chrome das Modell und lädt es nicht erneut. Alternativ kannst du das Verzeichnis OptGuideOnDeviceModel manuell löschen, dann aber AI Features in Chrome komplett ausschalten.
Gemini Nano powert Help me write in Textfeldern, Page Summaries für lange Artikel, Tab Group Suggestions, Smart Paste und On Device Scam Detection für eingehende Nachrichten. Diese Funktionen liegen tief in Kontextmenüs. Das prominente AI Mode Pill in der Adresszeile nutzt Gemini Nano nicht, sondern sendet alle Anfragen an Googles Server.
Chrome bietet aktuell fünf Built in AI APIs: Prompt API für freie Anfragen, Translator API für Übersetzungen, Summarizer API für Zusammenfassungen, Writer API für Textgenerierung und Rewriter API für Umformulierungen. Sie laufen im Origin Trial Modell und sind teils per Flag freischaltbar.
Die Prompt API ist über das globale ai.languageModel Objekt zugänglich. Erst availability prüfen, dann eine Session mit create erzeugen und mit prompt eine Anfrage stellen. Die Antwort kommt direkt aus dem lokalen Modell ohne Netzwerk Aufruf. Die Session sollte nach Gebrauch mit destroy geschlossen werden.
Solange Gemini Nano rein lokal arbeitet, fließen keine Daten an Google. Sobald jedoch eine Webseite die Built in AI APIs nutzt, kann sie Eingaben und Ausgaben sehen. Diese Daten unterliegen dann der Datenschutzerklärung der Webseite. Eine pauschale DSGVO Konformität gibt es nicht, sie hängt am konkreten Setup und Webseiten Verhalten.
Auf Desktop Chrome funktioniert Gemini Nano ab Chrome 138 auf Windows, macOS und Linux mit ausreichend RAM und Speicher. Auf Smartphones läuft Nano auf Pixel 8 Pro, Pixel 9 und Pixel 10. Andere Android Geräte können Gemini Nano über die AICore Komponente unterstützen, sofern der Hersteller es ausliefert.
Gemini 3 Flash läuft in Googles Cloud, hat ein Million Tokens Kontextfenster und ist für komplexe Coding und Agent Tasks gebaut. Gemini Nano läuft lokal auf dem Endgerät, hat ein deutlich kleineres Kontextfenster und ist für einfache Aufgaben wie Zusammenfassungen, Übersetzungen und Schreibhilfen optimiert.
Für lokale KI ohne Browser Bindung ist Ollama mit Qwen oder Llama die etablierte Open Source Alternative. Apple Foundation Models sind die beste Wahl im Apple Ökosystem. Auf Smartphones laufen Apps wie LLM Farm oder MLC Chat, die Open Source Modelle direkt auf iOS und Android ausführen, ohne Cloud Anbindung.
Ja. Gizmodo hat im Mai 2026 dokumentiert, dass das offline Gemini Nano auf einem Apple M2 schnell läuft, aber häufig Fakten erfindet. Korrekte Antworten wie Ouagadougou stehen neben fabrizierten Aussagen. Für Faktenfragen ist Gemini Nano damit kein zuverlässiges Werkzeug. Für Schreibhilfen, Zusammenfassungen und Übersetzungen ist die Qualität ausreichend.
Wenn du eine Privacy First Anwendung baust, die nur in Chrome laufen soll, sind die Built in AI APIs eine interessante Option. Für plattformübergreifende Lösungen ist eine Cloud API wie Gemini 3 Flash oder ein hybrider Stack mit lokalem Ollama Fallback meist die robustere Wahl. Wir beraten Teams gerne bei der Architektur Entscheidung.
Wie du mit Open-Source-Tools wie PostHog und GrowthBook plus KI-Coding-Agents professionelles A/B Testing selbst umsetzt - ohne teure SaaS-Loesungen.
Vercels offenes Ökosystem aus modularen Skill Packages für KI Coding Agents wie Claude Code, OpenCode, Cursor und Codex. Mit npx skills CLI, skills.sh Directory und mehr als 18 unterstützten Agenten.
Was ist AGI? Definition, aktueller Stand 2026, die große Debatte ob wir AGI bereits erreicht haben und was das für Entwickler und Unternehmen bedeutet.
Microsofts Open-Source-Framework für Multi-Agent-Systeme – autonome KI-Agenten, die miteinander kommunizieren und komplexe Aufgaben lösen.
Le Chat von Mistral schlägt ChatGPT 2026 in vier Dimensionen: DSGVO und EU AI Act, Geschwindigkeit mit Flash Answers, Preis, Open Source Verfügbarkeit.
OpenAIs ChatGPT im Überblick: Von GPT-5.2 bis GPT-5.4 mit allen Modellen, Features und der Einordnung für Entwickler.
Agent Teams ist das neue Feature in Claude Code: Mehrere KI-Instanzen arbeiten parallel an einem Projekt, koordinieren sich autonom und lösen komplexe Aufgaben schneller als ein einzelner Agent.
Der dezentrale Marktplatz für Claude-Code-Erweiterungen: Plugins finden, installieren und eigene Marketplaces erstellen.
Claude Code Plugins bündeln Slash-Commands, Agents, Hooks und MCP-Server in installierbare Pakete. Mit dezentralen Git-Marketplaces und über 4.600 Community-Repositories ist ein ganzes Ökosystem entstanden.
Claude Code Remote Control, SSH und Cloud Sessions im Vergleich: So arbeiten Entwickler 2026 ortsunabhängig mit dem KI-Coding-Agent von Anthropic.
Was ist Claude Cowork 2026? Der KI-Agent von Anthropic für Desktop-Automatisierung. Funktionen, Anwendungsfälle und Einschränkungen im Überblick.
Claude Design ist Anthropics KI Design Tool mit Opus 4.7. Prototypen, Wireframes und Pitch Decks aus Text, mit direktem Handoff zu Claude Code.
Claude Security scannt Codebases nach Schwachstellen und generiert Patches. Public Beta seit April 2026, powered by Opus 4.7.
Claw Code ist ein quelloffenes KI-Coding-Agent-Framework in Python und Rust. Clean-Room-Rewrite der Claude Code Architektur mit 172k GitHub Stars.
Schritt-für-Schritt Installationsanleitung für den Open-Source KI-Assistenten Clawdbot auf macOS, Linux und Windows mit Provider-Anbindung und Sicherheitskonfiguration.
Mac Mini als Always-on-Server für Clawdbot: Hardware-Empfehlung, macOS-Optimierung, Headless-Betrieb und Sicherheitskonfiguration für das Self-Hosted Setup.
CodeRabbit ist das meistinstallierte KI-Code-Review-Tool auf GitHub mit \u00fcber 2 Mio. verbundenen Repos und 13 Mio. reviewten Pull Requests.
CodexBar zeigt KI-Token-Limits für Claude Code, Cursor und Codex direkt in der macOS Menu Bar. Open Source, MIT-Lizenz, 7.400+ Stars.
ComfyUI ist die leistungsst\u00e4rkste Open-Source-Workflow-Engine f\u00fcr KI-Bildgenerierung. Lokal, DSGVO-konform, unterst\u00fctzt Flux, SDXL, Video und mehr.
Framework für rollenbasierte KI-Agenten-Teams – definiere Rollen, Ziele und Backstories, und lass die Crew autonom zusammenarbeiten.
Cursor BugBot ist Cursors KI-Agent für automatisches Code-Review und Debugging direkt im Editor. Mit über 2 Millionen analysierten Pull Requests pro Monat und einer Resolution Rate von 70 % ist er 2026 ein zentrales Tool im Vibe-Coding-Workflow.
Dify ist die Open Source Plattform für visuelle Agentic AI Workflows und Production grade LLM Apps. NCA bewertet Funktionen, Stärken und Use Cases 2026.
Open Source Embedding Modelle 2026 für RAG: Qwen3, BGE M3, Nomic, Jina und der Klassiker all MiniLM im strukturierten Vergleich mit Auswahlkriterien.
Überblick über Embodied AI Foundation Models und Vision Language Action Modelle 2026 für Robotik und physische Agenten.
Everything Claude Code (ECC) ist das größte Open Source Skill und Agent Ökosystem für KI Coding Agents. 178.000 GitHub Stars, MIT Lizenz, läuft in Claude Code und OpenCode.
Googles cloudbasierte Entwicklungsumgebung für Full-Stack-Apps mit Gemini-KI: Prototyping per Prompt, App-Deployment per Klick und kostenlos für 3 Workspaces.
Gemini 3.5 Flash schlägt Gemini 3.1 Pro auf agentischen Benchmarks bei einem Drittel des Preises. Verfügbar seit 19. Mai 2026 über Antigravity 2.0 und die Gemini API.
Die Gemini Familie 2026 mit Gemini 3.5 Flash, Gemini Omni Flash, Gemini 3.1 Pro und Deep Think im Vergleich. Benchmarks, Preise und Use Cases.
GitBook kombiniert technische Dokumentation mit KI Agent, MCP Server und Git Synchronisation. Überblick für Entwicklerteams und technische Autoren 2026.
GitHub MCP Server verbindet KI Agents direkt mit Repositories, Issues und CI/CD Pipelines. Installation und DSGVO Bewertung 2026.
Google Antigravity 2.0 bringt Desktop App, CLI, SDK und Managed Agents in der Gemini API. Powered by Gemini 3.5 Flash mit zwölffacher Geschwindigkeit.
Gemini Gems erstellen individuelle KI-Assistenten mit Live-Drive-Anbindung, 1M Token Kontext und Team-Sharing – die kostenlose ChatGPT-Custom-GPT-Alternative.
Google Stitch ist das KI-native Design-Tool aus Google Labs: UI per Text oder Sprache generieren, interaktiv prototypen und direkt in HTML/CSS exportieren.
Groq nutzt eigene LPU Chips für extrem schnelle Inferenz von Open Source Modellen wie Llama oder Qwen. Wann lohnt sich der Einsatz, wann ist Ollama oder vLLM die bessere Wahl?
Hermes Agent ist ein selbstlernender Open Source KI Agent von Nous Research mit persistentem Memory, autonomer Skill Erstellung und Multi Plattform Gateway für Telegram, Slack, WhatsApp und Discord.
Hugging Face ist die zentrale Plattform für Open Source KI Modelle mit 2 Millionen Modellen, Datasets, Spaces und Inference Endpoints. NCA Einordnung 2026.
Open Source Framework von HeyGen für lokales Video Rendering. HTML statt React, agent native für Claude Code und Cursor.
Andrej Karpathy ist einer der einflussreichsten LLM-Lehrer weltweit. Sein Wiki, seine GitHub-Projekte und YouTube-Kurse sind Pflichtlektüre für jeden KI-Entwickler.
Moonshot AIs Kimi Modellreihe: Von K2.5 bis K2.6 mit Agent Swarm, 1T MoE Parametern und Ollama Cloud. Alle Features und Benchmarks.
Open Source Framework für LLM Anwendungen mit Chains, Agents und LCEL Pipeline Syntax. Mit LangGraph für Orchestrierung, LangSmith für Evaluation und 1000 Integrationen.
LangChains Framework für zustandsbehaftete KI Workflows: Agenten als Graphen mit definierten Zuständen, Übergängen und Kontrollfluss.
Open Source Bibliothek für lokale LLM Inferenz in C/C++ ohne Abhängigkeiten. GGUF Format, Quantisierung, OpenAI kompatible API.
Open Source RAG Framework von Run-Llama für Indexing, Query Engines und agentenbasierte Document Processing. Im NCA Stack für DSGVO konforme Knowledge Bases mit Ollama.
KI-Modelle direkt auf iPhone und Android ausfuehren: Komplett offline, DSGVO-konform und ohne Cloud. Die besten Apps, Hardware-Anforderungen und Modelle fuer On-Device KI 2026.
LM Studio ist die GUI für lokale LLMs. Features, Ubuntu Installation und wann LM Studio die richtige Wahl ist.
Privacy first, local first, AGPL lizenziert. Logseq ist die DSGVO konforme Antwort auf Notion und Roam Research, mit Ollama Integration für lokale KI Workflows.
Wann DSGVO, Berufsgeheimnis und IP Schutz lokale KI erzwingen — die Szenarien mit Paragraphenbezug für Compliance Pflicht.
Wann sich lokale KI rechnet — Edge, Offline, Mass Processing, CI/CD und Kostenkontrolle als ROI Treiber 2026.
MemPalace ist ein Open Source KI Memory System von Milla Jovovich und Ben Sigman. Es speichert Konversationen lokal mit ChromaDB und SQLite, erreicht 96,6% auf LongMemEval und loest das Problem der KI Amnesie fuer Entwickler und Power User.
Open Source KI Prediction Engine mit GraphRAG und Multi Agent Simulation. Lade Dokumente hoch und simuliere Reaktionen tausender KI Agents.
Mistral AI ist Europas führender KI Anbieter aus Paris. Medium 3.5 mit 256K Kontext, Le Chat mit Work Mode und Vibe CLI Cloud Coding Agents im Überblick.
Mistral Connectors verbinden KI-Agents mit Enterprise-Daten per MCP-Protokoll. Reusable Tool-Integration in Mistral Studio 2026.
Das virale Social Network für KI-Agenten: Funktionsweise, Sicherheitsrisiken und die Debatte um autonome KI-Kommunikation.
Open-Source KI-Assistent mit 60.000+ GitHub Stars, der über WhatsApp, Telegram und andere Messaging-Apps gesteuert wird.
intfloat/multilingual-e5-large ist das stärkste kostenlose Embedding-Modell für RAG und Semantic Search. Self-hosted, MIT-Lizenz, 1024 Dimensionen, kein API-Key nötig.
Nano Banana 2 ist Googles neuester KI-Bildgenerator auf Basis von Gemini 3.1 Flash Image. Pro-Qualität bei Flash-Geschwindigkeit, kostenlos, mit 4K und Real-Time Web Search.
NVIDIA NemoClaw bringt Privacy- und Security-Guardrails zu autonomen KI-Agenten. Deploy mit einem Befehl, lokale Modelle via Nemotron, OpenShell-Controls.
Obsidian ist ein lokales, DSGVO-konformes Markdown-Wissenssystem mit nativer KI-Integration für Claude Code und Vibe Coding Workflows.
Ollama ist der führende Open-Source-Runner für lokale KI-Modelle. Mit über 150 Modellen, Subagenten-Support und integrierter Websuche macht Ollama KI-gestützte Entwicklung DSGVO-konform und offline-fähig.
Massively multilingual Zero Shot TTS Modell mit Voice Cloning und Voice Design. Apache 2.0, lokal lauffähig, 600 Sprachen Support.
Open WebUI ist eine browserbasierte Oberfläche für lokale KI-Modelle wie Ollama. DSGVO-konform, offline-fähig, erweiterbar durch RAG und Python-Tools – ideal für Entwickler und Unternehmen.
Der dreifach umbenannte KI-Agent – von ClawdBot über MoltBot zu OpenClaw. 100.000+ GitHub Stars, autonome Aufgabenausführung, und erhebliche Sicherheitsbedenken.
Spec-Driven Development Framework für AI Coding Assistants – eine Single Source of Truth für deterministische KI-Entwicklung.
Paperclip verwandelt einzelne KI Agenten in ein koordiniertes Unternehmen. Mit Org Charts, Budgetkontrolle und vollstaendigem Audit Log. Open Source und selbst gehostet.
Paperclip ist die Firma, Hermes Agent der Mitarbeiter mit Memory. Wann nutzt du welche Plattform, wo ergänzen sie sich, was passt zu deinem Stack.
Open Source macOS Automation Toolkit. CLI plus MCP Server für KI Agenten wie Codex, Claude Code und Cursor.
Claude Mythos Preview findet tausende Zero-Day-Schwachstellen in Betriebssystemen und Browsern. Was bedeutet das für Entwickler und DSGVO-konforme KI?
Qwen von Alibaba Cloud ist eine der stärksten Open-Source KI-Modellserien 2026. Qwen3, Qwen3-Coder, QwQ und Qwen3-Omni lokal nutzen – ohne API-Kosten, DSGVO-konform.
Der virale Marktplatz, auf dem KI-Agenten Menschen für reale Aufgaben buchen – per MCP-Call. Funktionsweise, Chancen und Risiken.
Ruflo koordiniert KI-Agenten-Swarms in Claude Code. Open Source, lokal betreibbar und DSGVO-konform. Die Enterprise-Alternative zu Cloud-basierten Agent-Plattformen.
Shannon analysiert Quellcode, findet Angriffsvektoren und f\u00fchrt echte Exploits aus \u2013 bevor sie in Produktion gelangen. Open Source, self-hosted, DSGVO-konform.
Subquadratic launcht SubQ mit Subquadratic Sparse Attention und 12 Millionen Token Context Window. NCA ordnet die Behauptungen und die Skepsis der Forschungs-Community ein.
Das Sylius MCP Server Plugin macht Ihren Onlineshop für KI Agenten zugänglich. Produktsuche, Warenkorb und Checkout per natürlicher Sprache.
Symfony AI Mate verbindet KI Assistenten mit PHP Projekten per Model Context Protocol. Profiler, Logs, Services direkt im KI Workflow.
Canonical bringt mit Ubuntu 26.04 LTS und Ubuntu 26.10 lokale KI Modelle als Inference Snaps direkt ins Betriebssystem.
Unsloth beschleunigt Fine Tuning von LLMs um Faktor 2 bei 70 Prozent weniger VRAM. NCA bewertet LoRA, QLoRA, DoRA und Use Cases für 2026.
Vise Coding ist der strukturierte Gegenansatz zu Vibe Coding: KI erzeugt nur kleine, pr\u00fcfbare \u00c4nderungen mit Tests und Dokumentation f\u00fcr echten Produktionscode.
High Performance LLM Serving mit PagedAttention, Continuous Batching und OpenAI kompatibler API. Ideal für DSGVO konformes Self Hosting.
NCA migrierte den eigenen Chatbot von OpenAI auf Voyage AI voyage-3-m-exp. Erfahrungsbericht: bessere Retrieval Qualität, DSGVO-nähere Kontrolle und konkrete Migrationstipps.
Das Model Context Protocol (MCP) ist der offene Standard f\u00fcr die Verbindung von KI-Agenten mit externen Tools und Datenquellen. Von Anthropic entwickelt, von der Linux Foundation verwaltet.
Alibabas 6B Parameter Bildmodell unter Apache 2.0. Lokal auf 16GB VRAM, 8 Inference Steps, bilinguales Text Rendering.