Spracherkennung für Pure Basic

In dieser Linux-Ecke dürfen nur Themen rund um Linux geschrieben werden.
Beiträge, die plattformübergreifend sind, gehören ins 'Allgemein'-Forum.
jogo
Beiträge: 64
Registriert: 22.11.2020 20:05
Computerausstattung: 'ne Handvoll gebrauchte Laptops & PCs mit Mint Mate

Spracherkennung für Pure Basic

Beitrag von jogo »

Moin zusammen,
ich denke über ein Projekt für Jemanden nach, der mit den Händen etwas eingeschränkt ist.
Ziel ist, ein zugerufenes Wort in einer hinterlegten Liste zu suchen und (wenn vorhanden) die damit verknüpfte Information als Text auf dem Monitor anzeigt.
Für Windows wäre ja die PB.Ex Speech von RSBasic die passende Basis für dieses Vorhaben.
Gibt es so etwas auch für Linux, was ich mit PB zusammen verwenden und mit meinen bescheidenen Kenntnissen realisieren kann?
--
Ideen gibt es viele - man muss sie nur haben...
Mint 18.3/19.3/21.x/LMDE5 // PureBasic 5.73 / 6.02
Benutzeravatar
juergenkulow
Beiträge: 188
Registriert: 22.12.2016 12:49
Wohnort: :D_üsseldorf-Wersten

Re: Spracherkennung für Pure Basic

Beitrag von juergenkulow »

Wiki Speech recognition software for Linux
Wie viel kostet ein günstiger Windows Rechner?
Bitte stelle Deine Fragen, denn den Erkenntnisapparat einschalten entscheidet über das einzig bekannte Leben im Universum.

Jürgen Kulow Wersten :D_üsseldorf NRW D Europa Erde Sonnensystem Lokale_Flocke Lokale_Blase Orion-Arm
Milchstraße Lokale_Gruppe Virgo-Superhaufen Laniakea Sichtbares_Universum
jogo
Beiträge: 64
Registriert: 22.11.2020 20:05
Computerausstattung: 'ne Handvoll gebrauchte Laptops & PCs mit Mint Mate

Re: Spracherkennung für Pure Basic

Beitrag von jogo »

in dieser Richtung habe ich ja bereits geforscht, nur konnte ich damit nicht so richtig was anfangen bzw. verstehe die Doku nicht (sicherlich mangels Kenntnisse & Durchblick). Habe da auch keinen richtigen Ansatz gefunden, das mit PB einzusetzen, bzw. hat sich das für mich nicht erschlossen.
Ich dachte eher an so etwas, was für die Benutzung mit PureBasic geeignet ist, zB. die PB.Ex Speech für Windows von RSBasic.
Bis jetzt habe ich den Eindruck gewonnen, dass dieses Vorhaben wohl 1 bis 2 Nummern zu groß für mich ist. Deshalb wollt ich hier mal nachfragen - für den Fall dass ich was übersehen habe oder Jemand in diesem Gebiet bereits Erfahrungen hat.

Klar, ich könnte das mit Windows versuchen, einen gebrauchten Windows-PC könnte ich schon günstig auftreiben. Wäre dann Plan B // muß mich dann erstmal wieder in Windows einarbeiten und ich habe den Menschen vor 2 Jahren überzeugt, Linux zu nutzen ^^ - aber ok, ich schau mal. Ist bis jetzt ja nur Planung und Machbarkeits-Forschung :-)
--
Ideen gibt es viele - man muss sie nur haben...
Mint 18.3/19.3/21.x/LMDE5 // PureBasic 5.73 / 6.02
DarkDragon
Beiträge: 6267
Registriert: 29.08.2004 08:37
Computerausstattung: Hoffentlich bald keine mehr
Kontaktdaten:

Re: Spracherkennung für Pure Basic

Beitrag von DarkDragon »

PCM Daten werden in ein recurrent neural network (RNN) gesteckt, der im output layer das alphabet abbildet. Wenn man dann von links nach rechts die argmaxe bei Änderung aufsammelt hat man den finalen String.

So ein RNN muss trainiert werden, dazu braucht man massig Daten. Eine Möglichkeit wäre https://datasetsearch.research.google.com/

Als Framework um nicht zuviel selbst machen zu müssen würde ich PyTorch oder Tensorflow empfehlen.
Angenommen es gäbe einen Algorithmus mit imaginärer Laufzeit O(i * n), dann gilt O((i * n)^2) = O(-1 * n^2) d.h. wenn man diesen Algorithmus verschachtelt ist er fertig, bevor er angefangen hat.
Benubi
Beiträge: 186
Registriert: 22.10.2004 17:51
Wohnort: Berlin, Wedding

Re: Spracherkennung für Pure Basic

Beitrag von Benubi »

Das ist schon immer ein interessantes Thema auch für mich gewesen.

Ich frag mich wie der Amiga "Say" Befehl das hinbekommen hat. Ich denke das waren nur 1-2 relativ kleine Dateien (der Befehl selbst und möglicherweise eine Library dazu) und es würde mich wundern wenn da RNN zum Einsatz kamen. Ist zwar nicht so ausgereift wie menschlich wirkende Stimmen heute, aber schon ziemlich cool und für meine Zwecke wäre das erstmal ausreichend gewesen.
Antworten