Beta
Windows ist derzeit eine öffentliche Beta. Diese Feature-Liste beschreibt den aktuellen Beta-Build. Rechne vor 1.0 noch mit Iterationen und Feinschliff.
Funktionen
Eine umfassende Übersicht über die Fähigkeiten von TypeWhisper unter Windows.
On-Device-Transkription
Die gesamte lokale Verarbeitung läuft auf deiner CPU mit ONNX Runtime und int8-Quantisierung - keine GPU erforderlich. Es stehen zwei Engines zur Verfügung:
- • Parakeet TDT 0.6B - Schnelle allgemeine Transkription mit Unterstützung für über 25 Sprachen. ~670 MB Download.
- • Canary 180M Flash - Mehrsprachiges Modell mit eingebauter Übersetzung zwischen Englisch, Deutsch, Französisch und Spanisch. ~200 MB Download.
Cloud-Transkription (optional)
Für höhere Genauigkeit oder schnellere Verarbeitung kannst du optional Cloud-Provider verbinden. Deine Sprachdaten bleiben auf deinem PC, solange du nicht ausdrücklich einen Cloud-Provider aktivierst. API-Keys werden per DPAPI verschlüsselt gespeichert.
| Anbieter | Modell | Hinweise |
|---|---|---|
| Groq | whisper-large-v3 | Schnelle Cloud-Transkription, unterstützt Übersetzung |
| Groq | whisper-large-v3-turbo | Am schnellsten, keine Übersetzung |
| OpenAI | gpt-4o-transcribe | Höchste Genauigkeit |
| OpenAI | gpt-4o-mini-transcribe | Geringere Kosten, gute Qualität |
| OpenAI | whisper-1 | Klassisch, unterstützt Übersetzung |
Konfiguriere Cloud-Provider in den Einstellungen oder während des Welcome Wizard.
Systemweites Diktieren
Nutze einen globalen Hotkey, um aus jeder App heraus die Aufnahme zu starten und zu stoppen. Transkribierter Text wird automatisch in das aktive Textfeld eingefügt. Der Standard-Hotkey ist Ctrl+Shift+F9 - du kannst ihn unter Settings > Hotkey ändern. Drei unabhängige Hotkey-Modi stehen zur Verfügung:
- • Hybrid - Kurzer Tastendruck startet oder stoppt die Aufnahme, langes Halten aktiviert Push-to-Talk. Die beste Mischung aus beidem.
- • Toggle - Einmal drücken zum Starten, erneut drücken zum Stoppen. Gut für längere Diktate ohne dauerhaftes Halten.
- • Push-to-Talk - Taste halten zum Aufnehmen, loslassen zum Stoppen und Transkribieren. Ideal für kurze Nachrichten oder präzise Kontrolle.
Live-Teilergebnisse
Silero VAD erkennt Sprachsegmente während der Aufnahme und transkribiert sie in Echtzeit. Ein schwebendes Overlay zeigt Teilergebnisse schon vor dem Stoppen der Aufnahme, sodass du sofort Feedback bekommst.
Datei-Transkription
Transkribiere Audio- und Videodateien direkt in der App. Ziehe Dateien auf das TypeWhisper-Fenster oder wähle sie über den Dateiauswahldialog aus.
- • Unterstützte Formate - WAV, MP3, M4A, AAC, OGG, FLAC, WMA, MP4, MKV, AVI, MOV, WebM
- • Batch-Verarbeitung - Mehrere Dateien in die Warteschlange stellen und nacheinander transkribieren
- • Export - Ergebnisse als TXT-, SRT- oder WebVTT-Untertitel mit genauen Zeitstempeln speichern
Übersetzung
TypeWhisper unterstützt drei Übersetzungsmethoden:
- • Canary on-device - Übersetzung zwischen Englisch, Deutsch, Französisch und Spanisch mit dem Canary 180M Flash Modell. Vollständig offline.
- • Marian on-device - Lokales ONNX-Übersetzungsmodell mit 20 Zielsprachen: EN, DE, FR, ES, IT, NL, PL, SV, DA, FI, CS, RU, UK, HU, JA, ZH, AR, HI, VI, ID. Kein Internet erforderlich.
- • Cloud LLM - Groq (Llama 3.3 70B) oder OpenAI (GPT-4o-mini) für beliebige Sprachpaare. Erfordert einen API-Key.
Lege Übersetzungsoptionen in den Einstellungen fest oder konfiguriere sie pro App über Profile.
Wörterbuch
Das Wörterbuch hat zwei Teile: Eigene Begriffe können an die Transkription übergeben werden, wenn die Engine das unterstützt, und Begriffskorrekturen werden nach der Transkription automatisch angewendet. Korrigiere Namen, Fachbegriffe oder wiederkehrende Fehlinterpretationen. Regex-Muster werden für fortgeschrittene Ersetzungen unterstützt.
Wenn du Parakeet verwendest, kannst du Vocabulary Boosting aktivieren, damit diese Begriffe lokal auf dem Gerät bereits während der Transkription berücksichtigt werden. Du musst das Wörterbuch nicht manuell erzwingen.
Windows enthält allgemeine Begriffspakete für technische, medizinische, finanzielle und kreative Themen. Zusätzlich gibt es lizenzierte Branchen-Packs für Immobilien, Architektur und Recht.
Snippets
Textkürzel, die automatisch expandieren. Definiere ein Triggerwort und den zugehörigen Ersetzungstext. Folgende dynamische Platzhalter werden unterstützt:
- •
{date},{time},{datetime}- Aktuelles Datum und Uhrzeit (benutzerdefinierte Formate unterstützt, z.B.{date:dd.MM.yyyy}) - •
{clipboard}- Aktueller Zwischenablageinhalt - •
{day},{year}- Aktueller Tagesname oder aktuelles Jahr
Whisper-Modus
Erhöhe die Mikrofonverstärkung für leises Sprechen oder laute Umgebungen. Wenn aktiviert, verstärkt TypeWhisper das Mikrofonsignal, sodass du auch leise sprechen und trotzdem genaue Transkriptionen erhalten kannst - nützlich in Großraumbüros, Bibliotheken oder spätabends. Umschaltbar pro Profil oder global in den Einstellungen.
Audio & Aufnahme
- • Audio Ducking - Reduziert die Systemlautstärke während der Aufnahme automatisch, um Hintergrundgeräusche aus anderen Anwendungen zu minimieren.
- • Media Pause - Pausiert Medienwiedergabe (Musik, Videos) während der Aufnahme automatisch und setzt sie danach fort.
- • Audio Normalization - Automatische Pegelanpassung für konsistente Eingangspegel, unabhängig davon, wie nah du am Mikrofon bist.
- • Silence Detection - Beendet die Aufnahme nach einer konfigurierbaren Stillephase automatisch, sodass du den Hotkey nicht erneut drücken musst.
- • Sound Feedback - Audiohinweise für Start und Ende der Aufnahme, damit du weißt, wann TypeWhisper zuhört.
- • Non-blocking Pipeline - Mehrere Aufnahmen können in die Warteschlange gestellt werden, während die Transkription im Hintergrund läuft. Starte die nächste Aufnahme, bevor die vorherige fertig verarbeitet ist.
Dashboard & Verlauf
- • Dashboard - Nutzungsstatistiken mit Gesamtwortzahl, Aufnahmedauer und Anzahl der Transkriptionen inklusive Aktivitätsdiagramm.
- • Transcription History - Alle Transkriptionen werden lokal mit Zeitstempeln, der Ziel-App und der verwendeten Engine bzw. dem Modell gespeichert. Durchsuche deinen Verlauf, bearbeite Transkriptionen inline und sieh Korrekturerkennung, die Unterschiede zwischen Original und Bearbeitung hervorhebt.