Offline-Spracherkennung: Unterschied zwischen den Versionen
Aus der Mikrocontroller.net Artikelsammlung, mit Beiträgen verschiedener Autoren (siehe Versionsgeschichte)
Esko (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
Esko (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
||
Zeile 1: | Zeile 1: | ||
Spracherkennung ohne Cloud, englisch ''speech recognition'' oder ''speech-to-text'' (STT). | Spracherkennung ohne Cloud, englisch ''speech recognition'' oder ''speech-to-text'' (STT). | ||
Oft wird keine echte | Oft wird keine echte Spracherkennung benötigt, also Diktat von freiem Text, sondern es reichen wenige vorher festgelegte ''Sprachbefehle'', oft wird auch der Begriff ''Sprachsteuerung'' verwendet, engl. intent (Licht an, Jalousien herunterfahren, etc). | ||
Daneben gibt es noch die wake-word-Erkennung. (Hallo Siri) | |||
===Sprachassistenten für Raspberry Pi=== | ===Sprachassistenten für Raspberry Pi=== | ||
Zeile 18: | Zeile 20: | ||
Hardwaremodule in Form von ICs oder Libraries für Controller bieten meist nur vorher definierte Sprachbefehle. | Hardwaremodule in Form von ICs oder Libraries für Controller bieten meist nur vorher definierte Sprachbefehle. | ||
* [https://picovoice.ai PicoVoice.AI] - Library für große Mikrocontroller, also ARM Cortex-M4...M7 [https://www.mikrocontroller.net/topic/520570 Anleitung Arduino] | |||
** Wakeword-Engine Porcupine | |||
** Sprachbefehl-System Rhino für English, Deutsch, Français, Español, Português, Italiano, 日本語, 한국어 | |||
** Spracherkennung PicoX (STT) Alpha-Stadium | |||
* [https://www.st.com/en/embedded-software/trulyhandsfree.html ST Sensory’s TrulyHandsfree Voice Control] STM32 Library | |||
* [https://www.voiceinterconnect.de/de/Sprachsteuerung_Ueberblick vicControl] bei [https://www.heise.de/ratgeber/Sprecher-unabhaengige-Spracherkennungsloesung-mit-vicControl-5045009.html heise.de Make: Sprecher-unabhängige Spracherkennung], siehe auch [https://cc2.tv/daten/20210130100000.php cc2.tv: vicCONTROL go] (DevKit) | * [https://www.voiceinterconnect.de/de/Sprachsteuerung_Ueberblick vicControl] bei [https://www.heise.de/ratgeber/Sprecher-unabhaengige-Spracherkennungsloesung-mit-vicControl-5045009.html heise.de Make: Sprecher-unabhängige Spracherkennung], siehe auch [https://cc2.tv/daten/20210130100000.php cc2.tv: vicCONTROL go] (DevKit) | ||
* [https://www.mikrocontroller.net/topic/503717 µc.net Diskussion: Sprachsteuerung / Spracherkennung] mit vielen ICs. (2020) | * [https://www.mikrocontroller.net/topic/503717 µc.net Diskussion: Sprachsteuerung / Spracherkennung] mit vielen ICs. (2020) | ||
Zeile 31: | Zeile 38: | ||
** [https://direct.nuvoton.com/de/nt-isd9160 Nuvoton ISD9160] IC | ** [https://direct.nuvoton.com/de/nt-isd9160 Nuvoton ISD9160] IC | ||
* [https://www.mikroe.com/speakup-click SpeakUp click] IC, sprecherabhängig, vorher aufgenommene Befehle | * [https://www.mikroe.com/speakup-click SpeakUp click] IC, sprecherabhängig, vorher aufgenommene Befehle | ||
===Open-Source=== | ===Open-Source=== |
Version vom 23. November 2021, 16:09 Uhr
Spracherkennung ohne Cloud, englisch speech recognition oder speech-to-text (STT).
Oft wird keine echte Spracherkennung benötigt, also Diktat von freiem Text, sondern es reichen wenige vorher festgelegte Sprachbefehle, oft wird auch der Begriff Sprachsteuerung verwendet, engl. intent (Licht an, Jalousien herunterfahren, etc).
Daneben gibt es noch die wake-word-Erkennung. (Hallo Siri)
Sprachassistenten für Raspberry Pi
Natürlich lauffähig auf jedem Linux-System.
- Rhasspy-Doku und Rhasspy-Forum
- Jasper
- Mycroft.ai Nur mit Aufwand Offline, siehe FAQ
- Home Assistant
Snipsbei c't und Elektor (übernommen von Sonos)
Windows-Software
- Windows Spracherkennung (Start -> Einstellungen -> Sprecherkennung)
- Dragon NaturallySpeaking (Wikipedia)
Hardwaremodul
Hardwaremodule in Form von ICs oder Libraries für Controller bieten meist nur vorher definierte Sprachbefehle.
- PicoVoice.AI - Library für große Mikrocontroller, also ARM Cortex-M4...M7 Anleitung Arduino
- Wakeword-Engine Porcupine
- Sprachbefehl-System Rhino für English, Deutsch, Français, Español, Português, Italiano, 日本語, 한국어
- Spracherkennung PicoX (STT) Alpha-Stadium
- ST Sensory’s TrulyHandsfree Voice Control STM32 Library
- vicControl bei heise.de Make: Sprecher-unabhängige Spracherkennung, siehe auch cc2.tv: vicCONTROL go (DevKit)
- µc.net Diskussion: Sprachsteuerung / Spracherkennung mit vielen ICs. (2020)
- Audeme MOVI Arduino Shield 75$ Sprecherunabhängig, "requires no voice samples for training and is speaker independent"
- GeeeTech Arduino Voice Recognition Module 20$ Unterscheidet ein paar Befehle, die vorher aufgenommen wurden.
- µc.net Diskussion: Spracherkennungs-chip low-power (2019)
- µc.net Diskussion: Welcher Mikrocontroller für Spracherkennung? (2017)
- µc.net Diskussion: Spracherkennung auf dem uC (2021)
- NXP EdgeReady MCU Based Solution for Local Voice Control
- voice INTER connect GmbH, Dresden Sprachsteuerung, Mikrofonarrays, Intercom-Produkte, VoIP-Telefone
- Library Machine learning with TensorFlow and Mbed OS
- Framework esp_sr für wake word, command recognition, acoustic algorithm (Echo Cancellation, Automatic Gain Control, Noise Suppression)
- Nuvoton ISD9160 IC
- SpeakUp click IC, sprecherabhängig, vorher aufgenommene Befehle
Open-Source
- Mozilla Common Voice und DeepSpeech
- Wikipedia: Software-Liste, davon Open-Source:
- Julius: Wikipedia und Ubuntu-Wiki Simon (Frontend)
- CMU Sphinx (Wikipedia) und PocketSphinx
- Kaldi (auch auf GitHub)
- Wikipedia: Janus Recognition Toolkit
- SOPARE in Python