Offline-Sprachausgabe (TTS): Unterschied zwischen den Versionen

Aus der Mikrocontroller.net Artikelsammlung, mit Beiträgen verschiedener Autoren (siehe Versionsgeschichte)
Wechseln zu: Navigation, Suche
Keine Bearbeitungszusammenfassung
Zeile 25: Zeile 25:
**** [https://discourse.mozilla.org/t/coqui-ai-is-here/77027 Mozilla-Forum]
**** [https://discourse.mozilla.org/t/coqui-ai-is-here/77027 Mozilla-Forum]
* [https://github.com/GHPS/txt2pho txt2pho (Hadifix)] Sprachausgabe-System entwickelt von der Universität Bonn, eingesetzt in zahlreichen Systemen für Blinde, Sprachqualität gut, sehr flexibel, geeignet für PC und Raspberry Pi
* [https://github.com/GHPS/txt2pho txt2pho (Hadifix)] Sprachausgabe-System entwickelt von der Universität Bonn, eingesetzt in zahlreichen Systemen für Blinde, Sprachqualität gut, sehr flexibel, geeignet für PC und Raspberry Pi
* [https://mimic.mycroft.ai Mimic von Mycroft] für Raspberry Pi
* [https://mimic.mycroft.ai Mimic von Mycroft] für Raspberry Pi. Deutsch mit [https://openvoice-tech.net/index.php?title=Using_Mycroft_with_German_Thorsten_voice dieser Anleitung].
* [https://wiki.ubuntuusers.de/Sprachausgabe/ Ubuntu-Wiki: Sprachausgabe] (alte und neue Programme)
* [https://wiki.ubuntuusers.de/Sprachausgabe/ Ubuntu-Wiki: Sprachausgabe] (alte und neue Programme)
* [https://github.com/synesthesiam/opentts OpenTTS] Sammlung von Docker images mit den Engines: Larynx, Coqui-TTS, Glow-Speak, nanoTTS, MaryTTS, flite, Festival, eSpeak


===Software kommerziell===
===Software kommerziell===
Zeile 41: Zeile 42:
==Siehe auch==
==Siehe auch==
* [[Offline-Spracherkennung|Offline-Spracherkennung (speech recognition)]]
* [[Offline-Spracherkennung|Offline-Spracherkennung (speech recognition)]]
* [https://openvoice-tech.net OpenVoice-Tech Wiki]

Version vom 6. Dezember 2021, 15:48 Uhr

Sprachsynthese ist die künstliche Erzeugung der menschlichen Sprechstimme, englisch Text-to-Speech (TTS).

Mikrocontroller

Mit einem kleinen Mikrocontroller ist Sprachsynthese nur in schlechter Qualität möglich, z.B.:

Mehr Sinn macht das Abspielen von kurzen Tonfetzen (Samples), die man kreativ zusammenfügt (fünf-zehn Uhr drei-ßig). Bei größerem Speicherbedarf kann man auf SD-Karten zurückgreifen, z.B. Elm-Chan SD8P, und dann ganze Sätze einspeichern.

Software Open-Source

Software kommerziell

Hardware-Modul oder IC

Hörproben

Siehe auch