Grüner Browser mit Gemini Nano Schriftzug und Rakete als Header zum On Device LLM

Was ist Gemini Nano?

Gemini Nano ist das kleinste Modell der Gemini Familie von Google. Anders als Gemini 3 Pro oder Flash läuft Gemini Nano direkt auf dem Endgerät. Das Modell wird im Chrome Browser und auf Pixel Smartphones lokal installiert und arbeitet ohne Cloud Verbindung. Mit rund 4 GB Größe sitzt es als weights.bin Datei im Ordner OptGuideOnDeviceModel und wird über die TFLite Engine und Googles MediaPipe Stack ausgeführt.

Gemini Nano powert in Chrome verschiedene KI Funktionen: Help me write in Textfeldern, Page Summaries, Tab Group Suggestions, Smart Paste und On Device Scam Detection. Auf Pixel Geräten kommt das Modell unter anderem für Recorder Zusammenfassungen und intelligente Antworten in Messaging Apps zum Einsatz. Für Webentwickler bietet Chrome ab Version 138 die Built in AI APIs Prompt, Translator, Summarizer, Writer und Rewriter.

Im Mai 2026 steht Gemini Nano im Zentrum einer Datenschutz Debatte. Privacy Forscher und Medien wie The Register, TechRadar und Quartz dokumentieren, dass Chrome das 4 GB Modell ohne explizite Nutzer Zustimmung auf Geräte herunterlädt und nach Löschung automatisch wiederherstellt. Computer Scientist Alexander Hanff argumentiert, dass diese Praxis gegen Article 5 Absatz 3 der ePrivacy Directive verstößt.

Gemini Nano mit NCA: Datenschutz Beratung vom Experten

NCA berät Teams seit Jahren beim Aufbau DSGVO konformer Stacks und beim Umgang mit On Device KI. Wir kennen die technische Funktionsweise von Gemini Nano, die rechtlichen Implikationen unter ePrivacy Directive und DSGVO sowie die Migrations Pfade hin zu europäischen Alternativen. Im NCA Production Stack laufen lokale Modelle über Ollama mit Qwen und Llama auf eigenen Servern in Deutschland.

Wir helfen Teams bei der Einordnung von Gemini Nano im eigenen Setup. Dazu zählen unsere Leistungen rund um lokale KI mit Ollama, die Migration zu llama.cpp basierten Setups, der Aufbau eines DSGVO freundlichen KI Tool Stacks, die Vibe Coding Beratung für Teams, die Gemini Nano als Frontend Baustein erwägen, und die Integration von On Device LLMs auf dem Smartphone.

Lass uns sprechen

Finde das passende Angebot für dein Projekt

🤖

Hey! Ich bin CodeBot. Lass uns herausfinden, wie wir dein Projekt zum Fliegen bringen.

Was soll entstehen?

Wo läuft Gemini Nano: Chrome, Pixel und Android

Gemini Nano läuft an drei Stellen. Erstens im Chrome Browser ab Version 138 auf Desktop Plattformen Windows, macOS und Linux. Zweitens auf Pixel Smartphones ab Pixel 8 Pro, Pixel 9 und Pixel 10 als Teil des Android Betriebssystems. Drittens optional auf neueren Android Geräten über die AICore Komponente, sofern der Hersteller diese ausliefert.

Das Modell wird in mehreren Größenstufen ausgeliefert. Auf Desktop Chrome ist die Datei rund 4 GB groß. Auf Pixel Smartphones läuft eine kleinere quantisierte Variante mit etwa 1 bis 2 GB. Die exakte Größe hängt vom Gerät, der RAM Ausstattung und der Build Variante ab. Mehrere Versions Verzeichnisse können sich addieren, wenn Chrome alte Modellversionen nicht zuverlässig aufräumt.

Wer Datenschutz priorisiert, sollte einen DSGVO freundlicheren Browser wie Brave oder Vivaldi in Betracht ziehen. Wir empfehlen unseren Kunden bei NCA grundsätzlich europäische Alternativen, wo möglich. Für lokale KI ohne Tracking ist Ollama mit Qwen oder Llama eine ausgereifte Lösung.

Built in AI APIs in Chrome: Prompt, Translator, Summarizer

Für Webentwickler ist Gemini Nano über die Built in AI APIs in Chrome zugänglich. Diese JavaScript Schnittstellen erlauben es, KI Funktionen direkt im Browser auszuführen, ohne Cloud Anbindung. Aktuell sind fünf APIs in unterschiedlichen Verfügbarkeitsstadien: Prompt API, Translator API, Summarizer API, Writer API und Rewriter API. Sie laufen im Origin Trial Modell und werden Schritt für Schritt zu stabilen Web Standards.

Ein einfacher Prompt API Aufruf sieht so aus: erst die Verfügbarkeit prüfen, dann eine Session erstellen und einen Prompt schicken. Die Antwort kommt direkt aus dem lokalen Modell, ohne Netzwerk Aufruf. Diese Eigenschaft ist für Privacy First Anwendungen interessant, etwa für Notiz Apps, Schreibhilfen und Übersetzer in regulierten Branchen.

Code:

          // Built in AI Prompt API in Chrome
const availability = await ai.languageModel.availability();
if (availability === 'available') {
  const session = await ai.languageModel.create({
    initialPrompts: [
      { role: 'system', content: 'You are a friendly assistant.' }
    ]
  });
  const result = await session.prompt('Was ist Vibe Coding?');
  console.log(result);
  session.destroy();
}

Die APIs sind aktuell in Chrome als Origin Trial verfügbar. Wer für eigene Webseiten experimentieren will, kann sich im Chrome Origin Trial Programm anmelden oder per Flag freischalten. Achtung: bestehende Webseiten können auf das lokale Modell zugreifen, sobald der Nutzer die API freigibt. Die Eingabe und Ausgabe sind dann unter der Datenschutzerklärung der jeweiligen Webseite zu betrachten.

Datenschutz Debatte Mai 2026: 4 GB Silent Install

Anfang Mai 2026 dokumentiert Privacy Forscher Alexander Hanff, dass Chrome das 4 GB Gemini Nano Modell ohne explizite Nutzer Zustimmung auf eligible Geräte herunterlädt. Die Datei landet im Verzeichnis OptGuideOnDeviceModel, ein generischer Name, der für Endnutzer kaum als Gemini Nano erkennbar ist. Wird die Datei manuell gelöscht, lädt Chrome sie automatisch wieder herunter.

Hanffs juristische Argumentation: Article 5 Absatz 3 der ePrivacy Directive verbietet das Speichern von Informationen auf Endgeräten ohne vorherige, freie, spezifische, informierte und unmissverständliche Zustimmung. Die 4 GB Modell Datei sei eine solche Information, die Bedingungen der Ausnahme nicht erfüllt, da Chrome auch ohne Datei voll funktioniert. Hanff schätzt die durch die Verteilung verursachten CO2 Äquivalent Emissionen weltweit auf 6.000 bis 60.000 Tonnen pro einmaligem Modell Push.

Eine zweite Kritik betrifft die AI Mode Deception in der Chrome Adresszeile. Das prominente AI Mode Pill suggeriert lokale Verarbeitung, obwohl jede Anfrage an Googles Server geschickt wird. Das lokale Gemini Nano powert nur Funktionen tief in Kontextmenüs, die kaum jemand findet. Google hat im April 2026 die Privacy Hinweise zu On Device AI angepasst, um Konflikte mit Datenschutz Aussagen zu vermeiden.

Google Chrome is reaching into users' machines and writing a 4 GB on-device AI model file to disk without asking. The file is named weights.bin. It lives in OptGuideOnDeviceModel. Chrome did not ask. Chrome does not surface it. If the user deletes it, Chrome re-downloads it.

Alexander Hanff, Privacy Forscher und Computer Scientist – That Privacy Guy Blog (7. Mai 2026)

Gemini Nano vs. Ollama mit Qwen vs. Apple Foundation Models

Gemini Nano ist nicht das einzige On Device LLM 2026. Wer sich für lokale KI interessiert, hat mehrere Optionen. Ollama mit Qwen oder Llama ist die etablierte Open Source Lösung für Desktop und Server. Die Modelle sind unter Apache 2.0 oder MIT Lizenz verfügbar, der User entscheidet selbst über Installation und Updates. Apple bietet auf eigenen Geräten Foundation Models über das macOS und iOS SDK, mit klarer Privacy Architektur.

Im direkten Vergleich punktet Gemini Nano mit nahtloser Browser Integration und sofortiger Verfügbarkeit über die Built in AI APIs. Schwächen sind die intransparente Installation, die fehlende Wahlfreiheit und die Bindung an das Chrome Ökosystem. Ollama bietet maximale Kontrolle, braucht aber initiales Setup und in der Regel mehr RAM. Apple Foundation Models sind die beste Wahl im Apple Ökosystem, aber nicht plattformübergreifend.

Eine vierte Variante ist LLM lokal auf dem Smartphone über Apps wie LLM Farm oder MLC Chat. Diese Apps lassen Open Source Modelle direkt auf iOS oder Android laufen, ohne Cloud Backend. Wer Gemini Nano umgehen will, aber auf On Device KI nicht verzichten möchte, fährt mit dieser Kombination am besten.

Gemini Nano abschalten und entfernen

Wer Gemini Nano nicht auf dem eigenen Rechner haben möchte, kann es seit Februar 2026 in Chrome direkt abschalten. Google hat nach Druck der Datenschutz Community ein Toggle in den Chrome Einstellungen ergänzt. Zusätzlich lässt sich das Modell über Chrome Flags blockieren. Wer prüfen will, ob Chrome bereits ein Modell installiert hat, kann das mit einem einfachen Terminal Befehl tun.

Code:

          # macOS: prüfen ob Chrome Gemini Nano installiert hat
du -sh ~/Library/Application\ Support/Google/Chrome/Default/OptGuideOnDeviceModel/

# Linux: gleiche Prüfung
du -sh ~/.config/google-chrome/Default/OptGuideOnDeviceModel/

# Windows: PowerShell
Get-ChildItem -Path "$env:LOCALAPPDATA\Google\Chrome\User Data\Default\OptGuideOnDeviceModel" -Recurse | Measure-Object -Property Length -Sum

Wenn ein Verzeichnis mit etwa 4 GB Daten erscheint, ist Gemini Nano installiert. Das Verzeichnis kann gelöscht werden, allerdings lädt Chrome es bei aktiven AI Features automatisch wieder herunter. Wer das verhindern will, deaktiviert in den Chrome Einstellungen unter Datenschutz und Sicherheit den Punkt On Device AI.

Alternativ ist der Wechsel zu einem Browser ohne Built in AI eine saubere Lösung. Brave und Vivaldi bieten Privacy First Eigenschaften ohne automatische KI Modell Downloads. Beide Browser laufen auf dem Chromium Unterbau, sind also zu Chrome Extensions kompatibel.

Gemini 3 Familie: Pro Flash Deep Think Vergleich 2026

Googles Gemini 3 Familie umfasst Pro, Flash, Flash Lite und Deep Think. ARC AGI 2 Benchmarks, 1M Context Window und Use Cases im Vergleich 2026.

Mehr erfahren

Gemini Nano im NCA Stack: Editorial Einordnung

Bei NCA setzen wir Gemini Nano nicht in unserer eigenen Production ein. Unser lokaler KI Stack basiert auf Ollama mit Qwen und Llama Modellen, die auf eigenen Servern in Deutschland mit Conversis Duisburg laufen. Diese Architektur bietet uns volle Kontrolle über Modell Versionen, Datenhaltung und Update Zyklen. Browser seitig empfehlen wir Brave oder Vivaldi für Endnutzer und Kundenteams.

Wir kennen Gemini Nano editorial und ordnen es für Beratungskunden ein. Die Browser Integration ist technisch beeindruckend und die Built in AI APIs sind ein interessanter Schritt in Richtung Web Standards. Gleichzeitig sehen wir die Datenschutz Risiken kritisch: die intransparente Installation, die fehlende Opt In Logik und die Bindung an Googles Browser Ökosystem widersprechen unserem Verständnis von User Sovereignty.

Wer mit Gemini Nano experimentieren möchte, sollte das in einem isolierten Test Setup tun, etwa in einem dedizierten Chrome Profil oder einer VM. Für Production empfehlen wir den Pfad über Ollama mit Open Source Modellen oder einen hybriden Stack mit Gemini 3 Flash für Cloud Use Cases und Ollama für lokale Tasks.

CYPRESS.IO Ambassador und IT Consultant für QA Engenieering und Qualität in PHP Projekten.

NCA Vibe Coding Consulting

Roland Golla ist Entwickler aus Leidenschaft – seit über 20 Jahren. Er hat hunderte Projekte begleitet, von Legacy-Refactoring bis KI-Integration. Bei Vibe Coding verbindet er das Beste aus beiden Welten: Die Geschwindigkeit von KI-generiertem Code mit der Qualität professioneller Softwareentwicklung. Kein Bullshit, keine Agentur-Floskeln – direkte Hilfe von jemandem, der selbst täglich im Code steckt.

E-Mail Kontakt

Häufige Fragen zu Gemini Nano

Wir sammeln hier die Fragen zu Gemini Nano, die uns aus der Beratungspraxis und aus der Datenschutz Debatte im Mai 2026 begegnen.

Was ist Gemini Nano 2026?

Gemini Nano ist Googles kleinstes Modell der Gemini Familie. Es läuft als On Device LLM lokal auf Chrome im Desktop und auf Pixel Smartphones. Mit rund 4 GB Größe powert es Funktionen wie Help me write, Page Summaries, Smart Paste und Scam Detection ohne Cloud Verbindung.

Wie groß ist Gemini Nano 2026?

Auf Desktop Chrome ist Gemini Nano rund 4 GB groß. Auf Pixel Smartphones läuft eine kleinere quantisierte Variante mit 1 bis 2 GB. Mehrere Versions Verzeichnisse können sich addieren, wenn Chrome alte Modellversionen nicht aufräumt. Manche Nutzer berichten von 12 GB und mehr Gesamtgröße.

Wo speichert Chrome Gemini Nano 2026?

Chrome speichert Gemini Nano im Verzeichnis OptGuideOnDeviceModel innerhalb des Chrome Default Profil Ordners. Die Hauptdatei heißt weights.bin und enthält die Modellgewichte. Der generische Verzeichnisname macht es schwer, die Datei eindeutig als Gemini Nano zu erkennen.

Verstößt Gemini Nano Silent Install gegen die DSGVO 2026?

Privacy Forscher Alexander Hanff argumentiert, dass die ungefragte Installation gegen Article 5 Absatz 3 der ePrivacy Directive verstößt. Eine endgültige juristische Klärung steht aus. Google hat im Februar 2026 eine Opt Out Option in den Chrome Einstellungen ergänzt und im April 2026 die Privacy Hinweise angepasst.

Wie schalte ich Gemini Nano ab 2026?

In den Chrome Einstellungen unter Datenschutz und Sicherheit findest du seit Februar 2026 einen Toggle für On Device AI. Wenn du ihn deaktivierst, deinstalliert Chrome das Modell und lädt es nicht erneut. Alternativ kannst du das Verzeichnis OptGuideOnDeviceModel manuell löschen, dann aber AI Features in Chrome komplett ausschalten.

Welche Funktionen powert Gemini Nano in Chrome?

Gemini Nano powert Help me write in Textfeldern, Page Summaries für lange Artikel, Tab Group Suggestions, Smart Paste und On Device Scam Detection für eingehende Nachrichten. Diese Funktionen liegen tief in Kontextmenüs. Das prominente AI Mode Pill in der Adresszeile nutzt Gemini Nano nicht, sondern sendet alle Anfragen an Googles Server.

Welche Built in AI APIs gibt es in Chrome?

Chrome bietet aktuell fünf Built in AI APIs: Prompt API für freie Anfragen, Translator API für Übersetzungen, Summarizer API für Zusammenfassungen, Writer API für Textgenerierung und Rewriter API für Umformulierungen. Sie laufen im Origin Trial Modell und sind teils per Flag freischaltbar.

Wie nutze ich die Built in AI Prompt API?

Die Prompt API ist über das globale ai.languageModel Objekt zugänglich. Erst availability prüfen, dann eine Session mit create erzeugen und mit prompt eine Anfrage stellen. Die Antwort kommt direkt aus dem lokalen Modell ohne Netzwerk Aufruf. Die Session sollte nach Gebrauch mit destroy geschlossen werden.

Ist Gemini Nano DSGVO konform?

Solange Gemini Nano rein lokal arbeitet, fließen keine Daten an Google. Sobald jedoch eine Webseite die Built in AI APIs nutzt, kann sie Eingaben und Ausgaben sehen. Diese Daten unterliegen dann der Datenschutzerklärung der Webseite. Eine pauschale DSGVO Konformität gibt es nicht, sie hängt am konkreten Setup und Webseiten Verhalten.

Welche Geräte unterstützen Gemini Nano?

Auf Desktop Chrome funktioniert Gemini Nano ab Chrome 138 auf Windows, macOS und Linux mit ausreichend RAM und Speicher. Auf Smartphones läuft Nano auf Pixel 8 Pro, Pixel 9 und Pixel 10. Andere Android Geräte können Gemini Nano über die AICore Komponente unterstützen, sofern der Hersteller es ausliefert.

Was ist der Unterschied zwischen Gemini Nano und Gemini 3 Flash?

Gemini 3 Flash läuft in Googles Cloud, hat ein Million Tokens Kontextfenster und ist für komplexe Coding und Agent Tasks gebaut. Gemini Nano läuft lokal auf dem Endgerät, hat ein deutlich kleineres Kontextfenster und ist für einfache Aufgaben wie Zusammenfassungen, Übersetzungen und Schreibhilfen optimiert.

Was ist die beste Alternative zu Gemini Nano?

Für lokale KI ohne Browser Bindung ist Ollama mit Qwen oder Llama die etablierte Open Source Alternative. Apple Foundation Models sind die beste Wahl im Apple Ökosystem. Auf Smartphones laufen Apps wie LLM Farm oder MLC Chat, die Open Source Modelle direkt auf iOS und Android ausführen, ohne Cloud Anbindung.

Halluziniert Gemini Nano oft?

Ja. Gizmodo hat im Mai 2026 dokumentiert, dass das offline Gemini Nano auf einem Apple M2 schnell läuft, aber häufig Fakten erfindet. Korrekte Antworten wie Ouagadougou stehen neben fabrizierten Aussagen. Für Faktenfragen ist Gemini Nano damit kein zuverlässiges Werkzeug. Für Schreibhilfen, Zusammenfassungen und Übersetzungen ist die Qualität ausreichend.

Lohnt sich Gemini Nano für mein Web Projekt?

Wenn du eine Privacy First Anwendung baust, die nur in Chrome laufen soll, sind die Built in AI APIs eine interessante Option. Für plattformübergreifende Lösungen ist eine Cloud API wie Gemini 3 Flash oder ein hybrider Stack mit lokalem Ollama Fallback meist die robustere Wahl. Wir beraten Teams gerne bei der Architektur Entscheidung.