Moin zusammen,
ich denke über ein Projekt für Jemanden nach, der mit den Händen etwas eingeschränkt ist.
Ziel ist, ein zugerufenes Wort in einer hinterlegten Liste zu suchen und (wenn vorhanden) die damit verknüpfte Information als Text auf dem Monitor anzeigt.
Für Windows wäre ja die PB.Ex Speech von RSBasic die passende Basis für dieses Vorhaben.
Gibt es so etwas auch für Linux, was ich mit PB zusammen verwenden und mit meinen bescheidenen Kenntnissen realisieren kann?
Spracherkennung für Pure Basic
-
- Beiträge: 64
- Registriert: 22.11.2020 20:05
- Computerausstattung: 'ne Handvoll gebrauchte Laptops & PCs mit Mint Mate
Spracherkennung für Pure Basic
--
Ideen gibt es viele - man muss sie nur haben...
Mint 18.3/19.3/21.x/LMDE5 // PureBasic 5.73 / 6.02
Ideen gibt es viele - man muss sie nur haben...
Mint 18.3/19.3/21.x/LMDE5 // PureBasic 5.73 / 6.02
- juergenkulow
- Beiträge: 188
- Registriert: 22.12.2016 12:49
- Wohnort: :D_üsseldorf-Wersten
Re: Spracherkennung für Pure Basic
Wiki Speech recognition software for Linux
Wie viel kostet ein günstiger Windows Rechner?
Wie viel kostet ein günstiger Windows Rechner?
Bitte stelle Deine Fragen, denn den Erkenntnisapparat einschalten entscheidet über das einzig bekannte Leben im Universum.
Jürgen Kulow Wersten :D_üsseldorf NRW D Europa Erde Sonnensystem Lokale_Flocke Lokale_Blase Orion-Arm
Milchstraße Lokale_Gruppe Virgo-Superhaufen Laniakea Sichtbares_Universum
Jürgen Kulow Wersten :D_üsseldorf NRW D Europa Erde Sonnensystem Lokale_Flocke Lokale_Blase Orion-Arm
Milchstraße Lokale_Gruppe Virgo-Superhaufen Laniakea Sichtbares_Universum
-
- Beiträge: 64
- Registriert: 22.11.2020 20:05
- Computerausstattung: 'ne Handvoll gebrauchte Laptops & PCs mit Mint Mate
Re: Spracherkennung für Pure Basic
in dieser Richtung habe ich ja bereits geforscht, nur konnte ich damit nicht so richtig was anfangen bzw. verstehe die Doku nicht (sicherlich mangels Kenntnisse & Durchblick). Habe da auch keinen richtigen Ansatz gefunden, das mit PB einzusetzen, bzw. hat sich das für mich nicht erschlossen.
Ich dachte eher an so etwas, was für die Benutzung mit PureBasic geeignet ist, zB. die PB.Ex Speech für Windows von RSBasic.
Bis jetzt habe ich den Eindruck gewonnen, dass dieses Vorhaben wohl 1 bis 2 Nummern zu groß für mich ist. Deshalb wollt ich hier mal nachfragen - für den Fall dass ich was übersehen habe oder Jemand in diesem Gebiet bereits Erfahrungen hat.
Klar, ich könnte das mit Windows versuchen, einen gebrauchten Windows-PC könnte ich schon günstig auftreiben. Wäre dann Plan B // muß mich dann erstmal wieder in Windows einarbeiten und ich habe den Menschen vor 2 Jahren überzeugt, Linux zu nutzen ^^ - aber ok, ich schau mal. Ist bis jetzt ja nur Planung und Machbarkeits-Forschung
Ich dachte eher an so etwas, was für die Benutzung mit PureBasic geeignet ist, zB. die PB.Ex Speech für Windows von RSBasic.
Bis jetzt habe ich den Eindruck gewonnen, dass dieses Vorhaben wohl 1 bis 2 Nummern zu groß für mich ist. Deshalb wollt ich hier mal nachfragen - für den Fall dass ich was übersehen habe oder Jemand in diesem Gebiet bereits Erfahrungen hat.
Klar, ich könnte das mit Windows versuchen, einen gebrauchten Windows-PC könnte ich schon günstig auftreiben. Wäre dann Plan B // muß mich dann erstmal wieder in Windows einarbeiten und ich habe den Menschen vor 2 Jahren überzeugt, Linux zu nutzen ^^ - aber ok, ich schau mal. Ist bis jetzt ja nur Planung und Machbarkeits-Forschung
--
Ideen gibt es viele - man muss sie nur haben...
Mint 18.3/19.3/21.x/LMDE5 // PureBasic 5.73 / 6.02
Ideen gibt es viele - man muss sie nur haben...
Mint 18.3/19.3/21.x/LMDE5 // PureBasic 5.73 / 6.02
-
- Beiträge: 6267
- Registriert: 29.08.2004 08:37
- Computerausstattung: Hoffentlich bald keine mehr
- Kontaktdaten:
Re: Spracherkennung für Pure Basic
PCM Daten werden in ein recurrent neural network (RNN) gesteckt, der im output layer das alphabet abbildet. Wenn man dann von links nach rechts die argmaxe bei Änderung aufsammelt hat man den finalen String.
So ein RNN muss trainiert werden, dazu braucht man massig Daten. Eine Möglichkeit wäre https://datasetsearch.research.google.com/
Als Framework um nicht zuviel selbst machen zu müssen würde ich PyTorch oder Tensorflow empfehlen.
So ein RNN muss trainiert werden, dazu braucht man massig Daten. Eine Möglichkeit wäre https://datasetsearch.research.google.com/
Als Framework um nicht zuviel selbst machen zu müssen würde ich PyTorch oder Tensorflow empfehlen.
Angenommen es gäbe einen Algorithmus mit imaginärer Laufzeit O(i * n), dann gilt O((i * n)^2) = O(-1 * n^2) d.h. wenn man diesen Algorithmus verschachtelt ist er fertig, bevor er angefangen hat.
Re: Spracherkennung für Pure Basic
Das ist schon immer ein interessantes Thema auch für mich gewesen.
Ich frag mich wie der Amiga "Say" Befehl das hinbekommen hat. Ich denke das waren nur 1-2 relativ kleine Dateien (der Befehl selbst und möglicherweise eine Library dazu) und es würde mich wundern wenn da RNN zum Einsatz kamen. Ist zwar nicht so ausgereift wie menschlich wirkende Stimmen heute, aber schon ziemlich cool und für meine Zwecke wäre das erstmal ausreichend gewesen.
Ich frag mich wie der Amiga "Say" Befehl das hinbekommen hat. Ich denke das waren nur 1-2 relativ kleine Dateien (der Befehl selbst und möglicherweise eine Library dazu) und es würde mich wundern wenn da RNN zum Einsatz kamen. Ist zwar nicht so ausgereift wie menschlich wirkende Stimmen heute, aber schon ziemlich cool und für meine Zwecke wäre das erstmal ausreichend gewesen.