Supertonic (Experimental) - TypeWhisper Add-ons

Über

Supertonic ist TypeWhispers experimenteller lokaler Text-to-Speech-Anbieter für Supertonic-3-ONNX-Modelle. Das Plugin lädt die Modellassets in TypeWhispers Plugin-Datenverzeichnis und erzeugt Sprache danach lokal für gesprochenes Feedback und Vorlesen.

Die Modellassets sind separat von TypeWhisper unter OpenRAIL-M lizenziert. TypeWhisper verlangt deshalb, dass du die Supertonic-3-Modelllizenz prüfst und akzeptierst, bevor Modell-Dateien heruntergeladen werden.

Der Screenshot oben dokumentiert die aktuelle macOS-Konfiguration. Der Katalogeintrag enthält zusätzlich Windows, damit das Add-on im Windows-Plattformfilter erscheint, sobald das passende Windows-Bundle verfügbar ist.

Voraussetzungen & Datenschutz

Voraussetzung	Details
TypeWhisper	Erfordert TypeWhisper `1.4.0` oder neuer.
macOS	Erfordert macOS `14.0` oder neuer auf Apple Silicon (`arm64`).
Modell-Download	Lädt Supertonic-3-ONNX-Dateien und Voice-Style-JSON-Dateien von Hugging Face.
Lizenz-Gate	Der Modell-Download bleibt deaktiviert, bis die OpenRAIL-M-Bedingungen in den Einstellungen akzeptiert wurden.
Netzwerkzugriff	Netzwerk wird für Modell-Downloads und optionale Hugging-Face-Token-Prüfung genutzt. Die Spracherzeugung läuft lokal, sobald das Modell im Cache liegt.
Zugangsdaten	Für Synthese ist kein API-Key nötig. Ein Hugging-Face-Token ist optional und hilft nur bei Download-Rate-Limits.

Modelllizenz & Download

Feld	Was es steuert	Hinweise
Open Supertonic 3 OpenRAIL-M license	Öffnet die Modelllizenz vor dem Download.	Prüfe die Nutzungsbeschränkungen vor der Annahme.
I have read and accept…	Speichert die Annahme für die aktuelle Supertonic-3-Lizenz-ID und -Revision.	Der Download bleibt deaktiviert, bis diese Option aktiviert ist.
Download & Load	Lädt die erforderlichen ONNX-Modell-Dateien und Voice-Style-JSON-Dateien.	Während des Downloads wird der Fortschritt angezeigt.
Bereit	Bestätigt, dass die erforderlichen Modellassets lokal vorhanden sind.	TypeWhisper kann Sprache erzeugen, sobald dieser Status erscheint.
Delete cached model	Entfernt den zwischengespeicherten Modellordner.	Nutze das, um Speicherplatz freizugeben oder einen frischen Download zu erzwingen.
Hugging Face Token	Optionaler Token für Hugging-Face-Anfragen.	Nützlich, wenn Downloads ohne Anmeldung in Rate-Limits laufen.

Stimme & Qualität

Einstellung	Werte	Hinweise
Voice	Standard ist `M1`; gebündelte Style-Namen enthalten `M1` und `F1`, weitere gefundene Voice-Style-Dateien werden ebenfalls gelistet.	Das Plugin zeigt verfügbare Voice-Style-JSON-Dateien als TypeWhisper-Stimmen an.
Speed	`0,70` bis `2,00`, Schritt `0,05`; Standard `1,05`.	Niedrigere Werte verlangsamen die erzeugte Sprache, höhere Werte beschleunigen sie.
Quality	`Fast`, `Balanced`, `High`; Standard `Balanced`.	Höhere Qualität nutzt mehr Synthese-Schritte.

Unterstützte Sprachhinweise sind unter anderem en, de, fr, es, it, ja, ko, pt, nl, pl, sv, tr, uk, vi und weitere. Nicht unterstützte oder leere Sprachhinweise fallen auf Englisch zurück.

Einrichtung

Öffne TypeWhisper Einstellungen > Plugins.
Konfiguriere Supertonic (Experimental).
Prüfe die Supertonic-3-OpenRAIL-M-Lizenz.
Akzeptiere die Modelllizenz-Bedingungen.
Ergänze nur dann einen Hugging-Face-Token, wenn Downloads in Rate-Limits laufen.
Klicke auf Download & Load und warte auf Bereit.
Wähle Stimme, Geschwindigkeit und Qualitätsmodus.
Wähle Supertonic als Text-to-Speech-Anbieter für gesprochenes Feedback oder Vorlesen.

Hinweise

Supertonic ist experimentell und wird hier anhand der macOS-Einstellungsoberfläche dokumentiert.
Die Spracherzeugung läuft lokal, nachdem der Modell-Download abgeschlossen ist.
Modellassets werden separat heruntergeladen, weil sie der Supertonic-3-OpenRAIL-M-Lizenz unterliegen.
Das Löschen des gecachten Modells entfernt weder deine Lizenzannahme noch einen optional gespeicherten Hugging-Face-Token.