Diaoul Posté(e) le 18 décembre 2011 Posté(e) le 18 décembre 2011 Reconnaissance vocale via python : OK TTS via python : OK Les sources sont ici si vous voulez compilez vous même : https://github.com/SynoCommunity/spksrc/tree/speech 0 Citer
Remylpat Posté(e) le 19 décembre 2011 Auteur Posté(e) le 19 décembre 2011 Salut Diaoul, Je veux bien reessayer de compiler en esperant ne pas tout "failed" encore une fois mais peux tu me re-expliquer (ou me reguider) tout depuis le début. ce que je dois installer sur mon syno ou ailleurs. Ce que je dois lancer ... ce que je récupere et ce que j'en fais .... ;-) Meme en mode télégraphique ca me va. En tout cas meme si pour le moment je vois pas ce que ca donne c'est super ce que vous avez (l'air) d'avoir fait. 0 Citer
Diaoul Posté(e) le 19 décembre 2011 Posté(e) le 19 décembre 2011 Bah j'ai rien fait pour l'instant mais disons que je peux faire en sorte que mon Syno répète ce que je dis avec un dictionnaire simple "Dial one one two" (du quickstart de julius par voxforge) Je vais démarrer un projet Python pour gérer les actions à effectuer en fonction des phrases identifiées. J'hésite encore à le faire en django... 0 Citer
Diaoul Posté(e) le 28 décembre 2011 Posté(e) le 28 décembre 2011 Bon, voici le lien du projet : https://github.com/Diaoul/Dobby Un peu de détails sur mon Clapper paramétrable qui fonctionne avec pyaudio (module Python de portaudio) : https://github.com/Diaoul/Dobby/blob/master/triggers/clapper.py Si vous avez des suggestions n'hésitez pas. Je trouve le code un peu lourd pour le Clapper 0 Citer
Sp@r0 Posté(e) le 29 décembre 2011 Posté(e) le 29 décembre 2011 Je viens de jeter un coup d'oeil (surtout au clapper) et je te tire mon chapeau c'est très bien écrit en tous cas vue de mon niveau c'est à qq années lumières de moi ..... J'ai presque honte d'avoir montré mon code .... qui bien qu'utilisant un concept similaire est largement moins élégant .... Passant sur la forme mais allons voir sur le fond le gros soucis que j'ai avec la reconnaissance de la voie c'est la qualité du micro. En effet je me rends compte qu'un micro standard fonctionne assez mal dés que l'on s'écarte de quelques mètres (sans parler du soucis des bruits de fond), j'ai vue qu'il existait des micros dédiés à la reconnaissance vocal dans une pièce, mais c'est super chère !!!! Sans parler du principe du clapper ou il est difficile d'obtenir un équilibre entre les faux positifs (ma fille qui passe en criant dans le salon) et le fait de s'exploser les mains en clappant .... Et toi de ton coté Diaoul tu as retrouver les même soucis ou c'est le mic de ma webcam qui est particulièrement pourrit ???? 0 Citer
Diaoul Posté(e) le 29 décembre 2011 Posté(e) le 29 décembre 2011 Alors perso j'ai fait mes tests dans un environnement sans trop de bruit sur un micro d'un micro-casque USB. Comme tu dis, pour obtenir le même rendu que ça avec un mic de webcam ça va être difficile, surtout si on rajoute la distance. J'ai aussi testé avec mon mic de webcam et oui c'est particulièrement pourrit ! J'avais vu un micro multidirectionnel dans les 30€, je pense que je testerai avec ça le temps voulu. Sinon, il y a sans doute la possibilité de retraiter le son pour enlever un maximum de choses (sauf la voix) avec quelques réglages sur la fréquence de la voix de l'utilisateur. Pour être intéressant je pense qu'il faut qu'une distance d'environ 1 à 2m donne satisfaction, plus c'est vraiment avec un bon micro et pour une utilisation partout dans la pièce. Tu noteras qu'avec le design actuel du Clapper, on peut lancer plusieurs Clapper sur différentes sources audio et récupérer le résultat dans la même event_queue. Je pense même stocker le numero du micro capté dans l’évènement ainsi que la Sequence qui a été matchée (pour une éventuelle utilisation ultérieure) 0 Citer
Remylpat Posté(e) le 29 décembre 2011 Auteur Posté(e) le 29 décembre 2011 Salut à tous, Tout d'abord bonnes fetes .... Je vois que tu as encore fais des étincelles Diaoul, un jour il faudra que qqn m'explique comment je peux vous aider pour tester ou autre, j'aimerais bien contribuer a ce projet. Sinon l'idée du casque de Diaoul, me fait penser a qqc : Pensez-vous que cela serait possible de faire fonctionner le "SiriLogy" (Siri + Synology) avec un casque/oreillette bluetooth ? Je me dis ca car ca permettrait peut etre aussi d'avoir une utilisation plus personelle et surtout ca coute bcp moins cher qu'un micro multidirectionel. D'un côté j'aime bien l'idee d'etre n'importe ou dans la piece et de dire le mot magique, d'un autre côté ca peut aussi gener les autre personnes autour de moi d'entendre la réponse du nas sur les enceinte, la TV ou tout autre device. Donnez moi votre avis et mettez moi a contribution sans soucis. Encore bravo 0 Citer
Diaoul Posté(e) le 29 décembre 2011 Posté(e) le 29 décembre 2011 A vrai dire, peu importe l'input et l'output dans Dobby, c'est entièrement paramètrable grace à portaudio et speech-dispatcher. Le fichier de config est là pour ça. Comme je disais, dans les Event levés par les Triggers (comme le Clapper), je vais intégrer le numéro de la source audio (micro) utilisée. Comme ça on pourra faire un traitement spécifique selon la source dans les Actions. Par contre ce qu'il ne sera pas possible de faire avec le design actuel de Dobby c'est l'écoute et la réponse à plusieurs personnes simultanément. Dans ce cas le mieux ce sera de lancer plusieurs Dobby et plusieurs Julius. 0 Citer
Diaoul Posté(e) le 29 décembre 2011 Posté(e) le 29 décembre 2011 Ca me fait penser qu'en fait avec un micro blutooth attaché à la chemise ou une oreillette + micro à l'oreille, on résoudrait certainement les problèmes de Sp@ro sur la qualité du microphone en fonction de la distance ! De mon coté j'ai contacté http://www.acousticmagic.com pour savoir s'il m'était possible d'essayer un de leurs produits quelques jours afin de voir si le résultat est correct pour une utilisation 100% autonome. J'ai pas à ma disposition de clé USB blutooth et je ne sais même pas si ce sera reconnu par Syno. Quelqu'un a-t-il la possibilité de tester ? Ca peut valoir le coup (et même le coût). 0 Citer
Remylpat Posté(e) le 29 décembre 2011 Auteur Posté(e) le 29 décembre 2011 j'ai une clé usb bluetooth et je dois avoir un micro/casque bluetooth aussi. Je peux bien tester tout ca la semaine prochaine si vous le voulez. par contre faudrait juste me guider pour l'installation j'ai deja vu dans un forum parler d'un package "bluez" pour bluetooth il me semble. je retrouve mon dongle bluetooth j'install sur mon syno les ipkg et je vous dis si ca detecte qqc des lundi. En // comment je fait tourner tout ton travail diaoul sur mon DS109 ? 0 Citer
Remylpat Posté(e) le 29 décembre 2011 Auteur Posté(e) le 29 décembre 2011 Voila les packages dispo pour le bluetooth via ipkg. Ca vous parle a vous ? Package I-Ver P-Ver Comment install bluez-hcidump 1.42-1 Bluetooth packet analyzer. install bluez-libs 3.36-1 Bluetooth libraries. install bluez-utils 3.36-3 Bluetooth utilities. install bluez2-libs 2.25-1 Bluetooth libraries. install bluez2-utils 2.25-6 Bluetooth utilities. install py-bluez 0.9.2-1 Python wrappers around bluez. install py25-bluez 0.9.2-1 Python wrappers around bluez. 0 Citer
PiwiLAbruti Posté(e) le 29 décembre 2011 Posté(e) le 29 décembre 2011 De mon coté j'ai contacté http://www.acousticmagic.com pour savoir s'il m'était possible d'essayer un de leurs produits quelques jours afin de voir si le résultat est correct pour une utilisation 100% autonome. À $250 le ticket d'entrée, ça calme un peu quand même. 0 Citer
Diaoul Posté(e) le 29 décembre 2011 Posté(e) le 29 décembre 2011 j'ai une clé usb bluetooth et je dois avoir un micro/casque bluetooth aussi. Je peux bien tester tout ca la semaine prochaine si vous le voulez. par contre faudrait juste me guider pour l'installation j'ai deja vu dans un forum parler d'un package "bluez" pour bluetooth il me semble. je retrouve mon dongle bluetooth j'install sur mon syno les ipkg et je vous dis si ca detecte qqc des lundi. En // comment je fait tourner tout ton travail diaoul sur mon DS109 ? C'est loin d'être prêt pour un utilisateur. Eventuellement un power user qui n'a pas peur de mettre les mains dans le cambouis. Ce que tu peux juste faire c'est voir si c'est reconnu sur ton Syno en bidouillant un peu. À $250 le ticket d'entrée, ça calme un peu quand même. Ca dépend, si c'est la solution ultime qui marche à la perfection, pourquoi pas. Et puis d'occasion ou un modèle équivalent chez la concurence ça doit se trouver. 0 Citer
Remylpat Posté(e) le 29 décembre 2011 Auteur Posté(e) le 29 décembre 2011 Je sais pas si je peux me considérer comme PowerUser mais je suis pas trop mal cablé et mon diplome d'ingé en informatique ne remonte pas a si loin ;-p C'est côté linux que je seche un peu. J'ai commencé a me documenter sur la partie bluetooth et j'ai hate de me remettre devant mon syno pour apairer une oreillette.J'ai trouvé qq bonnes pistes sur les QNAPs qui vont me servir de base. Pour ce qui est de la partie Dobby je veux bien bidouiller mais comment je repars de ton github ou de qq chose d'autre ? 0 Citer
Diaoul Posté(e) le 29 décembre 2011 Posté(e) le 29 décembre 2011 Y'a rien qui marche sur GitHub pour l'instant D'ailleurs, dans mon SPK de test j'ai même pas essayé pyaudio (portaudio sur Python). Je fais ça sur mon PC pour l'instant. Quand quelque chose sera prêt vous serez les premiers à savoir 0 Citer
Diaoul Posté(e) le 29 décembre 2011 Posté(e) le 29 décembre 2011 Pour ceux que ça intéresse de faire des essais, le retour de acousticmagic : Thank you for your interest in Acoustic Magic. The Voice Tracker™ has been used successfully for voice control. See: http://www.acousticmagic.com/user-comments.html#ccrosby Our process for evaluation is for you to buy a Voice Tracker™, and we give you a full refund (excluding shipping) when you return it within 30 days. Regards 0 Citer
Diaoul Posté(e) le 30 décembre 2011 Posté(e) le 30 décembre 2011 (modifié) Un SPK de test est dispo ici : http://syno.diaoul.fr/SPKs/hastation La procédure d'installation est simple : Installer le SPK Crééer un groupe d'utilisateur "audio" et mettre "root" dedans en éditant /etc/group Il y a tout ce qu'il faut dedans, y comprit pyaudio pour faire tourner le clapper sur son Syno. /usr/local/hastation/ Modifié le 30 décembre 2011 par Diaoul 0 Citer
Remylpat Posté(e) le 31 décembre 2011 Auteur Posté(e) le 31 décembre 2011 Salut Diaoul je test tout ca lundi et te fais un retour Bon reveillon a tous 0 Citer
Remylpat Posté(e) le 1 janvier 2012 Auteur Posté(e) le 1 janvier 2012 Salut Diaoul, Finalement je suis rentré un peu plus tot et je n'ai pas pu m'empecher d'installer ton spk. Pour l'install tout c'est passé nickel. J'ai bien créé le group et mis root dedans J'ai bien qq repertoires (bin,include,openssl.cnf,share,etc,lib,sbin) dans /usr/local/hastation. Je n'ai par contre pas trouvé de daemon a lancer ou quoi que ce soit me permettant de "runner" le prg. J'ai omis qqc ? Enfin je n'ai pas trouvé non plus ou se cachait le clappeur. Je regarderais un peu plus demain. Bonne nuit a tous 0 Citer
Diaoul Posté(e) le 2 janvier 2012 Posté(e) le 2 janvier 2012 Je t'ai dis qu'il n'y a pas de programme pour l'instant. C'est juste un tas de binaire cross-compilés pour bidouiller. julius pour la reconnaissance vocale espeak et flite pour le TTS speech-dispatcher python 2.7 avec les modules pyaudio et speechd Si tu veux tu peux regarder les documentations de ces binaires et t'amuser avec. Il n'y a pas et n'y aura pas de programme tout fait dans ce SPK avant longtemps et ne t'en fais pas tu ne pourras pas le louper. 0 Citer
Remylpat Posté(e) le 3 janvier 2012 Auteur Posté(e) le 3 janvier 2012 Salut a tous, Je commence a faire des tests avec les différents binaires de Diaoul, mais je rencontre un pb ave le micro. J'ai une carte son terratec avec Line input intégré. Pour identifier mon micro je fait ffmpeg -f oss -i /dev/dsp4 test.wav (methode Sp@ro) J'ai bien mon micro de la carte son Terratec en /dev/dsp4 mais aucun son ne s'enregistre. Lorque je lance alsamixer et que je unmute mon micro, j'entends bien le son dans mes HPs donc le micro fonctionne bien. J'ai donc essayé de brancher ma camera USB comme vous. Le micro est detecté en /dev/dsp5 et si je fais un ffmpeg -f oss -i /dev/dsp5 test.wav j'ai bien ma voix recordé par mon micro de camera. Vous n'auriez pas une idée sur comment activer l'entrée mic de ma carte USB ou d'ou cela pourrait provenir ? 0 Citer
Diaoul Posté(e) le 3 janvier 2012 Posté(e) le 3 janvier 2012 (modifié) Essaye ce script pour lister tes devices : import pyaudio pa = pyaudio.PyAudio() for i in range(pa.get_device_count()): print repr(pa.get_device_infos_by_index(i)) Pas sûr de la syntaxe des fonctions appelées, regarde la doc de pyaudio. Modifié le 3 janvier 2012 par Diaoul 0 Citer
Remylpat Posté(e) le 3 janvier 2012 Auteur Posté(e) le 3 janvier 2012 Ca commence fort : ./inputdevice.py Traceback (most recent call last): File "./inputdevice.py", line 2, in <module> import pyaudio OUPS 0 Citer
Diaoul Posté(e) le 3 janvier 2012 Posté(e) le 3 janvier 2012 :facepalm: /usr/local/hastation/bin/python inputdevice.py 0 Citer
Remylpat Posté(e) le 3 janvier 2012 Auteur Posté(e) le 3 janvier 2012 (modifié) Voila l'output mais je t'avoue j'ai un peu du mal ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.rear ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.center_lfe ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.side ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.hdmi ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.hdmi ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.modem ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.modem ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.phoneline ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.phoneline ALSA lib pcm_dsnoop.c:612:(snd_pcm_dsnoop_open) unable to open slave ALSA lib pcm_dmix.c:957:(snd_pcm_dmix_open) The dmix plugin supports only playback stream Traceback (most recent call last): File "inputdevice.py", line 5, in <module> print repr(pa.get_device_infos_by_index(i)) AttributeError: PyAudio instance has no attribute 'get_device_infos_by_index' si je fais un lsusb j'ai DiskStation> lsusb Bus 001 Device 004: ID 046d:08c7 Logitech, Inc. Bus 001 Device 003: ID 0ccd:0077 TerraTec Electronic GmbH Bus 001 Device 002: ID 05e3:0608 Genesys Logic, Inc. USB-2.0 4-Port HUB Bus 001 Device 001: ID 1d6b:0002 Modifié le 3 janvier 2012 par Remylpat 0 Citer
Messages recommandés
Rejoindre la conversation
Vous pouvez publier maintenant et vous inscrire plus tard. Si vous avez un compte, connectez-vous maintenant pour publier avec votre compte.