Offline-Sprachausgabe (TTS): Unterschied zwischen den Versionen
Aus der Mikrocontroller.net Artikelsammlung, mit Beiträgen verschiedener Autoren (siehe Versionsgeschichte)
Esko (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
|||
Zeile 25: | Zeile 25: | ||
**** [https://discourse.mozilla.org/t/coqui-ai-is-here/77027 Mozilla-Forum] | **** [https://discourse.mozilla.org/t/coqui-ai-is-here/77027 Mozilla-Forum] | ||
* [https://github.com/GHPS/txt2pho txt2pho (Hadifix)] Sprachausgabe-System entwickelt von der Universität Bonn, eingesetzt in zahlreichen Systemen für Blinde, Sprachqualität gut, sehr flexibel, geeignet für PC und Raspberry Pi | * [https://github.com/GHPS/txt2pho txt2pho (Hadifix)] Sprachausgabe-System entwickelt von der Universität Bonn, eingesetzt in zahlreichen Systemen für Blinde, Sprachqualität gut, sehr flexibel, geeignet für PC und Raspberry Pi | ||
* [https://mimic.mycroft.ai Mimic von Mycroft] für Raspberry Pi | * [https://mimic.mycroft.ai Mimic von Mycroft] für Raspberry Pi. Deutsch mit [https://openvoice-tech.net/index.php?title=Using_Mycroft_with_German_Thorsten_voice dieser Anleitung]. | ||
* [https://wiki.ubuntuusers.de/Sprachausgabe/ Ubuntu-Wiki: Sprachausgabe] (alte und neue Programme) | * [https://wiki.ubuntuusers.de/Sprachausgabe/ Ubuntu-Wiki: Sprachausgabe] (alte und neue Programme) | ||
* [https://github.com/synesthesiam/opentts OpenTTS] Sammlung von Docker images mit den Engines: Larynx, Coqui-TTS, Glow-Speak, nanoTTS, MaryTTS, flite, Festival, eSpeak | |||
===Software kommerziell=== | ===Software kommerziell=== | ||
Zeile 41: | Zeile 42: | ||
==Siehe auch== | ==Siehe auch== | ||
* [[Offline-Spracherkennung|Offline-Spracherkennung (speech recognition)]] | * [[Offline-Spracherkennung|Offline-Spracherkennung (speech recognition)]] | ||
* [https://openvoice-tech.net OpenVoice-Tech Wiki] |
Version vom 6. Dezember 2021, 15:48 Uhr
Sprachsynthese ist die künstliche Erzeugung der menschlichen Sprechstimme, englisch Text-to-Speech (TTS).
Mikrocontroller
Mit einem kleinen Mikrocontroller ist Sprachsynthese nur in schlechter Qualität möglich, z.B.:
- Henrik Haftmann TU Chemnitz. Text -> Lautschrift -> Phoneme -> PCM-Wave
- AVR-Freaks-Diskussion
- SAM Software Automatic Mouth C64-Programm konvertiert nach C
Mehr Sinn macht das Abspielen von kurzen Tonfetzen (Samples), die man kreativ zusammenfügt (fünf-zehn Uhr drei-ßig). Bei größerem Speicherbedarf kann man auf SD-Karten zurückgreifen, z.B. Elm-Chan SD8P, und dann ganze Sätze einspeichern.
- LPC-Kompression mit Talkie für Arduino (dazu Hörprobe und Zeitungsartikel)
- Verbessert von ArminJo
Software Open-Source
- Wikipedia Sprachsynthese-Software, darunter Open-Soure:
- MaryTTS vom DFKI Qualität passabel
- PicoTTS Qualität ok
- Wikipedia: eSpeak NG (Qualität mäßig)
- HTS Qualität ok, nur österreichisch
- Mozilla TTS
- Deutsche Stimme von Thorsten Müller. Sehr gut, aber rechenintensiv. In 2021 in schneller Entwicklung. Gemeinfrei CC0.
- 🐸Coqui.ai
- txt2pho (Hadifix) Sprachausgabe-System entwickelt von der Universität Bonn, eingesetzt in zahlreichen Systemen für Blinde, Sprachqualität gut, sehr flexibel, geeignet für PC und Raspberry Pi
- Mimic von Mycroft für Raspberry Pi. Deutsch mit dieser Anleitung.
- Ubuntu-Wiki: Sprachausgabe (alte und neue Programme)
- OpenTTS Sammlung von Docker images mit den Engines: Larynx, Coqui-TTS, Glow-Speak, nanoTTS, MaryTTS, flite, Festival, eSpeak
Software kommerziell
- Acapela Stimme Julia deutsch für Android
- Windows-Programm 500€
Hardware-Modul oder IC
- Wikipedia: Sprachsynthese-Hardware (ICs)
- Redcedar (1970er und 80er)
Hörproben
- www.TTSsamples.SyntheticSpeech.de von Prof. Dr. Felix Burkhardt