Supertonic (Experimental)
Mitgeliefertvon TypeWhisper
Über
Supertonic ist TypeWhispers experimenteller lokaler Text-to-Speech-Anbieter für Supertonic-3-ONNX-Modelle. Das Plugin lädt die Modellassets in TypeWhispers Plugin-Datenverzeichnis und erzeugt Sprache danach lokal für gesprochenes Feedback und Vorlesen.
Die Modellassets sind separat von TypeWhisper unter OpenRAIL-M lizenziert. TypeWhisper verlangt deshalb, dass du die Supertonic-3-Modelllizenz prüfst und akzeptierst, bevor Modell-Dateien heruntergeladen werden.
Der Screenshot oben dokumentiert die aktuelle macOS-Konfiguration. Der Katalogeintrag enthält zusätzlich Windows, damit das Add-on im Windows-Plattformfilter erscheint, sobald das passende Windows-Bundle verfügbar ist.
Voraussetzungen & Datenschutz
| Voraussetzung | Details |
|---|---|
| TypeWhisper | Erfordert TypeWhisper 1.4.0 oder neuer. |
| macOS | Erfordert macOS 14.0 oder neuer auf Apple Silicon (arm64). |
| Modell-Download | Lädt Supertonic-3-ONNX-Dateien und Voice-Style-JSON-Dateien von Hugging Face. |
| Lizenz-Gate | Der Modell-Download bleibt deaktiviert, bis die OpenRAIL-M-Bedingungen in den Einstellungen akzeptiert wurden. |
| Netzwerkzugriff | Netzwerk wird für Modell-Downloads und optionale Hugging-Face-Token-Prüfung genutzt. Die Spracherzeugung läuft lokal, sobald das Modell im Cache liegt. |
| Zugangsdaten | Für Synthese ist kein API-Key nötig. Ein Hugging-Face-Token ist optional und hilft nur bei Download-Rate-Limits. |
Modelllizenz & Download
| Feld | Was es steuert | Hinweise |
|---|---|---|
| Open Supertonic 3 OpenRAIL-M license | Öffnet die Modelllizenz vor dem Download. | Prüfe die Nutzungsbeschränkungen vor der Annahme. |
| I have read and accept… | Speichert die Annahme für die aktuelle Supertonic-3-Lizenz-ID und -Revision. | Der Download bleibt deaktiviert, bis diese Option aktiviert ist. |
| Download & Load | Lädt die erforderlichen ONNX-Modell-Dateien und Voice-Style-JSON-Dateien. | Während des Downloads wird der Fortschritt angezeigt. |
| Bereit | Bestätigt, dass die erforderlichen Modellassets lokal vorhanden sind. | TypeWhisper kann Sprache erzeugen, sobald dieser Status erscheint. |
| Delete cached model | Entfernt den zwischengespeicherten Modellordner. | Nutze das, um Speicherplatz freizugeben oder einen frischen Download zu erzwingen. |
| Hugging Face Token | Optionaler Token für Hugging-Face-Anfragen. | Nützlich, wenn Downloads ohne Anmeldung in Rate-Limits laufen. |
Stimme & Qualität
| Einstellung | Werte | Hinweise |
|---|---|---|
| Voice | Standard ist M1; gebündelte Style-Namen enthalten M1 und F1, weitere gefundene Voice-Style-Dateien werden ebenfalls gelistet. | Das Plugin zeigt verfügbare Voice-Style-JSON-Dateien als TypeWhisper-Stimmen an. |
| Speed | 0,70 bis 2,00, Schritt 0,05; Standard 1,05. | Niedrigere Werte verlangsamen die erzeugte Sprache, höhere Werte beschleunigen sie. |
| Quality | Fast, Balanced, High; Standard Balanced. | Höhere Qualität nutzt mehr Synthese-Schritte. |
Unterstützte Sprachhinweise sind unter anderem en, de, fr, es, it, ja, ko, pt, nl, pl, sv, tr, uk, vi und weitere. Nicht unterstützte oder leere Sprachhinweise fallen auf Englisch zurück.
Einrichtung
- Öffne TypeWhisper Einstellungen > Plugins.
- Konfiguriere Supertonic (Experimental).
- Prüfe die Supertonic-3-OpenRAIL-M-Lizenz.
- Akzeptiere die Modelllizenz-Bedingungen.
- Ergänze nur dann einen Hugging-Face-Token, wenn Downloads in Rate-Limits laufen.
- Klicke auf Download & Load und warte auf Bereit.
- Wähle Stimme, Geschwindigkeit und Qualitätsmodus.
- Wähle Supertonic als Text-to-Speech-Anbieter für gesprochenes Feedback oder Vorlesen.
Hinweise
- Supertonic ist experimentell und wird hier anhand der macOS-Einstellungsoberfläche dokumentiert.
- Die Spracherzeugung läuft lokal, nachdem der Modell-Download abgeschlossen ist.
- Modellassets werden separat heruntergeladen, weil sie der Supertonic-3-OpenRAIL-M-Lizenz unterliegen.
- Das Löschen des gecachten Modells entfernt weder deine Lizenzannahme noch einen optional gespeicherten Hugging-Face-Token.