KI & Entwickler

Google Gemini API-Preisrechner

Schätze, was die Google Gemini-API kostet. Wähle ein Modell, gib Input- und Output-Tokens pro Anfrage sowie deine Anzahl an Anfragen ein — und erhalte Kosten pro Anfrage, pro Tag und pro Monat.

Preisdaten aktualisiert: June 2026.

Wie die Google Gemini-API-Preise funktionieren

Google Gemini rechnet nach Tokens ab, nicht pro Anfrage. Ein Token ist ein Textstück — etwa vier Zeichen oder ein Dreiviertelwort im Englischen. Du zahlst getrennt für Input-Tokens (dein Prompt) und Output-Tokens (die Antwort des Modells), und Output ist fast immer teurer.

Die Preise gelten pro 1.000.000 Tokens, sodass die Kosten pro Anfrage winzig sind — genau deshalb unterschätzt man das Budget leicht, bis man mit echtem Traffic multipliziert.

Kosten = (Input ÷ 1M × Input-Preis) + (Output ÷ 1M × Output-Preis), × Anfragen

Google Gemini-Modellpreise

Pro 1M Tokens, Stand Juni 2026. Bestätige vor der Budgetierung stets das Aktuelle auf der offiziellen Google Gemini-Preisseite:

ModellInput / 1MOutput / 1M
Gemini 2.5 Pro$1.25$10.00
Gemini 2.5 Flash$0.3$2.50
Gemini 2.5 Flash-Lite$0.1$0.4

Deine Token-Anzahl schätzen

  • Faustregel: ~4 Zeichen oder ~0,75 Wörter pro Token. 1.000 Tokens ≈ 750 Wörter ≈ 1,5 Seiten.
  • Vergiss den System-Prompt nicht und etwaige Few-Shot-Beispiele — sie werden bei jedem Aufruf als Input berechnet.
  • Output ist variabel. Begrenze ihn mit einem Max-Token-Limit, damit eine ausufernde Antwort dein Budget nicht sprengt.

Rechenbeispiel

Mit Gemini 2.5 Pro zu $1.25 Input / $10.00 Output pro 1M Tokens kostet eine Anfrage mit 1.000 Input- und 500 Output-Tokens etwa $0.0063. Macht man 10.000 davon im Monat, landet man bei rund $62.50/Monat — etwa $750.00 im Jahr. Wechsle oben das Modell, um sofort zu vergleichen.

So senkst du deine API-Rechnung

  • Modell richtig dimensionieren. Nutze ein kleineres/günstigeres Modell für einfache Aufgaben und reserviere das Flaggschiff für schwere.
  • Prompt-Caching nutzen, falls Google Gemini es anbietet — wiederkehrender Kontext (System-Prompts, Dokumente) kann stark vergünstigt abgerechnet werden.
  • Prompt kürzen. Entferne überflüssige Anweisungen und zu lange Beispiele; kürzerer Input ist direkt günstiger.
  • Bündeln und begrenzen. Batch-APIs kosten oft weniger, und ein Output-Limit verhindert Überraschungskosten.

So benutzt du diesen Rechner

  1. Modell wählen. Wähle das Google Gemini-Modell, das du aufrufst — Input- und Output-Preise unterscheiden sich je Stufe stark.
  2. Tokens pro Anfrage eingeben. Lege die durchschnittlichen Input- und Output-Tokens einer typischen Anfrage fest (etwa 4 Zeichen pro Token).
  3. Anfragen pro Monat eingeben. Dein erwartetes monatliches Aufrufvolumen.
  4. Prognose ablesen. Sieh Kosten pro Anfrage, pro 1.000 Anfragen, pro Tag und pro Jahr, sofort aktualisiert.

Andere Anbieter vergleichen: alle KI- & Entwickler-Tools ansehen.

Häufige Fragen

Sind diese Preise aktuell?

Die Preise gelten Stand Juni 2026 und können sich ändern. Bestätige sie vor der Budgetierung immer auf der offiziellen Preisseite des Anbieters. Die Rechnung selbst ist exakt.

Wie werden die Kosten berechnet?

Kosten = (Input-Tokens ÷ 1.000.000 × Input-Preis) + (Output-Tokens ÷ 1.000.000 × Output-Preis), multipliziert mit deiner Anzahl an Anfragen.

Wie viele Tokens hat mein Text?

Eine grobe Faustregel für Englisch: ~4 Zeichen oder ~0,75 Wörter pro Token. 1.000 Tokens ≈ 750 Wörter.

Warum ist Output teurer als Input?

Tokens zu erzeugen ist rechenintensiver als sie zu lesen, daher bepreisen Anbieter Output höher — oft das 3- bis 5-Fache des Input-Tarifs. Knappe Antworten sind eine der einfachsten Spar-Methoden.

Sind Steuern oder Mindestbeträge enthalten?

Nein. Der Rechner zeigt nur die Nutzungskosten. Deine Rechnung kann Steuern hinzufügen, und manche Tarife haben Mindestbeträge oder Mengenrabatte — prüfe deine Vertragsbedingungen.