Offline-Spracherkennung: Unterschied zwischen den Versionen

Aus der Mikrocontroller.net Artikelsammlung, mit Beiträgen verschiedener Autoren (siehe Versionsgeschichte)
Wechseln zu: Navigation, Suche
Keine Bearbeitungszusammenfassung
(Dicio)
Zeile 54: Zeile 54:
* [https://de.wikipedia.org/wiki/Janus_Recognition_Toolkit Wikipedia: Janus Recognition Toolkit]
* [https://de.wikipedia.org/wiki/Janus_Recognition_Toolkit Wikipedia: Janus Recognition Toolkit]
* [https://www.bishoph.org SOPARE] in Python
* [https://www.bishoph.org SOPARE] in Python
* [https://alphacephei.com/vosk/ Vosk] ist ein ''speech recognition toolkit'' mit 20 Sprachen, darunter Deutsch, Englisch, Chinesisch, Russisch; 50 MB je Sprache. Läuft auf Raspberry Pi, Android, iOS.
* [https://alphacephei.com/vosk/ Vosk] ist ein ''speech recognition toolkit'' mit 20 Sprachen, darunter Deutsch, Englisch, Chinesisch, Russisch; 50 MB je Sprache. Läuft auf Raspberry Pi, Android, iOS. [https://f-droid.org/packages/org.dicio.dicio_android F-Droid: Dicio Voice assistant] mit offline vosk Spracherkennung.


==Siehe auch==
==Siehe auch==
* [[Offline-Sprachausgabe (TTS)]]
* [[Offline-Sprachausgabe (TTS)]]
* [https://openvoice-tech.net OpenVoice-Tech Wiki]
* [https://openvoice-tech.net OpenVoice-Tech Wiki]

Version vom 28. Dezember 2021, 09:11 Uhr

Spracherkennung ohne Cloud, englisch speech recognition oder speech-to-text (STT).

Oft wird keine echte Spracherkennung benötigt, also Diktat von freiem Text, sondern es reichen wenige vorher festgelegte Sprachbefehle, auch Sprachsteuerung genannt, engl. intent (z.B. Licht an, Jalousien herunterfahren).

Daneben gibt es noch das Aktivierungswort um die Spracherkennung aufzuwecken engl. wake-word (z.B. Hey Mercedes). Die nötige Rechenleistung muss gering sein und oft wird die Funktion offline auf dem Endgerät ausgeführt, teilweise von einem spezialisierten Prozessor. Wikipedia:Aktivierungswort

Theoretische Grundlagen gibt es auf Wikipedia:Spracherkennung.

Sprachassistenten für Raspberry Pi

Natürlich lauffähig auf jedem Linux-System.

Windows-Software

  • Windows Spracherkennung (Start -> Einstellungen -> Sprecherkennung)
  • Dragon NaturallySpeaking (Wikipedia)

Hardwaremodul

Hardwaremodule in Form von ICs oder Libraries für Controller bieten meist nur vorher definierte Sprachbefehle.

Open-Source

Siehe auch