Beta

Windows ist derzeit eine öffentliche Beta. Die Windows-API ist bereits für lokale Tools nutzbar, aber das Gesamtprodukt befindet sich noch in der Beta.

HTTP API

TypeWhisper enthält eine lokale REST-API für die Integration mit externen Tools und Skripten.

Hinweis: Die API ist standardmäßig deaktiviert. Aktiviere sie unter Settings > API und konfiguriere den Port (Standard: 9876). Die API akzeptiert nur Verbindungen von localhost.

Status prüfen

# Check if the API is ready

curl http://localhost:9876/v1/status

{
  "status": "ready",
  "engine": "parakeet",
  "model": "nvidia_parakeet-tdt-0.6b-v2",
  "supports_streaming": false,
  "supports_translation": true
}

Audio transkribieren

# Send an audio file for transcription

curl -X POST http://localhost:9876/v1/transcribe \

-F "file=@recording.wav" \

-F "language=en"

{
  "text": "Hello, world!",
  "language": "en",
  "duration": 2.5,
  "processing_time": 0.8,
  "engine": "parakeet",
  "model": "nvidia_parakeet-tdt-0.6b-v2"
}

Optionale Parameter

  • language - ISO-639-1-Code (z.B. en, de). Weglassen für automatische Erkennung.
  • task - transcribe (Standard) oder translate.
  • target_language - ISO-639-1-Code für die Zielsprache der Übersetzung (z.B. de, fr). Wird mit Canary oder Marian verwendet.

Modelle auflisten

# Get available models (local + cloud)

curl http://localhost:9876/v1/models

{
  "models": [
    {
      "id": "nvidia_parakeet-tdt-0.6b-v2",
      "engine": "parakeet",
      "downloaded": true,
      "active": true
    },
    {
      "id": "nvidia_canary-180m-flash",
      "engine": "canary",
      "downloaded": true,
      "active": false
    },
    {
      "id": "whisper-large-v3",
      "engine": "groq",
      "downloaded": true,
      "active": false
    },
    {
      "id": "gpt-4o-transcribe",
      "engine": "openai",
      "downloaded": true,
      "active": false
    }
  ]
}

Cloud-Modelle erscheinen, sobald du in den Einstellungen einen API-Key für den jeweiligen Anbieter konfiguriert hast.

Fehlerantworten

Die API gibt Standard-HTTP-Statuscodes mit einem JSON-Fehlerkörper zurück:

{
  "error": "No model loaded",
  "code": "MODEL_NOT_LOADED"
}

Häufige Fehlercodes

  • 400 - Fehlendes oder ungültiges file -Feld, nicht unterstütztes Audioformat oder ungültiger Parameterwert.
  • 503 - Kein Modell ist geladen. Lade ein Modell herunter und aktiviere es zuerst in den Einstellungen.
  • 500 - Interner Fehler während der Transkription. Prüfe die App-Logs für Details.