Tts Sur Son Nas

Diaoul · le 18 décembre 2011

Reconnaissance vocale via python : OK
TTS via python : OK

Les sources sont ici si vous voulez compilez vous même : https://github.com/SynoCommunity/spksrc/tree/speech

Remylpat · le 19 décembre 2011

Salut Diaoul,

Je veux bien reessayer de compiler en esperant ne pas tout "failed" encore une fois mais peux tu me re-expliquer (ou me reguider) tout depuis le début.

ce que je dois installer sur mon syno ou ailleurs.

Ce que je dois lancer ...

ce que je récupere et ce que j'en fais .... ;-)

Meme en mode télégraphique ca me va.

En tout cas meme si pour le moment je vois pas ce que ca donne c'est super ce que vous avez (l'air) d'avoir fait.

Diaoul · le 19 décembre 2011

Bah j'ai rien fait pour l'instant mais disons que je peux faire en sorte que mon Syno répète ce que je dis avec un dictionnaire simple "Dial one one two" (du quickstart de julius par voxforge)

Je vais démarrer un projet Python pour gérer les actions à effectuer en fonction des phrases identifiées. J'hésite encore à le faire en django...

Diaoul · le 28 décembre 2011

Bon, voici le lien du projet : https://github.com/Diaoul/Dobby

Un peu de détails sur mon Clapper paramétrable qui fonctionne avec pyaudio (module Python de portaudio) : https://github.com/Diaoul/Dobby/blob/master/triggers/clapper.py

Si vous avez des suggestions n'hésitez pas. Je trouve le code un peu lourd pour le Clapper

Sp@r0 · le 29 décembre 2011

Je viens de jeter un coup d'oeil (surtout au clapper) et je te tire mon chapeau c'est très bien écrit en tous cas vue de mon niveau c'est à qq années lumières de moi .....

J'ai presque honte d'avoir montré mon code .... qui bien qu'utilisant un concept similaire est largement moins élégant .... Passant sur la forme mais allons voir sur le fond le gros soucis que j'ai avec la reconnaissance de la voie c'est la qualité du micro.

En effet je me rends compte qu'un micro standard fonctionne assez mal dés que l'on s'écarte de quelques mètres (sans parler du soucis des bruits de fond), j'ai vue qu'il existait des micros dédiés à la reconnaissance vocal dans une pièce, mais c'est super chère !!!! Sans parler du principe du clapper ou il est difficile d'obtenir un équilibre entre les faux positifs (ma fille qui passe en criant dans le salon) et le fait de s'exploser les mains en clappant ....

Et toi de ton coté Diaoul tu as retrouver les même soucis ou c'est le mic de ma webcam qui est particulièrement pourrit ????

Diaoul · le 29 décembre 2011

Alors perso j'ai fait mes tests dans un environnement sans trop de bruit sur un micro d'un micro-casque USB. Comme tu dis, pour obtenir le même rendu que ça avec un mic de webcam ça va être difficile, surtout si on rajoute la distance.

J'ai aussi testé avec mon mic de webcam et oui c'est particulièrement pourrit !

J'avais vu un micro multidirectionnel dans les 30€, je pense que je testerai avec ça le temps voulu. Sinon, il y a sans doute la possibilité de retraiter le son pour enlever un maximum de choses (sauf la voix) avec quelques réglages sur la fréquence de la voix de l'utilisateur.

Pour être intéressant je pense qu'il faut qu'une distance d'environ 1 à 2m donne satisfaction, plus c'est vraiment avec un bon micro et pour une utilisation partout dans la pièce.

Tu noteras qu'avec le design actuel du Clapper, on peut lancer plusieurs Clapper sur différentes sources audio et récupérer le résultat dans la même event_queue. Je pense même stocker le numero du micro capté dans l’évènement ainsi que la Sequence qui a été matchée (pour une éventuelle utilisation ultérieure)

Remylpat · le 29 décembre 2011

Salut à tous,

Tout d'abord bonnes fetes ....

Je vois que tu as encore fais des étincelles Diaoul, un jour il faudra que qqn m'explique comment je peux vous aider pour tester ou autre, j'aimerais bien contribuer a ce projet.

Sinon l'idée du casque de Diaoul, me fait penser a qqc :

Pensez-vous que cela serait possible de faire fonctionner le "SiriLogy" (Siri + Synology) avec un casque/oreillette bluetooth ?

Je me dis ca car ca permettrait peut etre aussi d'avoir une utilisation plus personelle et surtout ca coute bcp moins cher qu'un micro multidirectionel.

D'un côté j'aime bien l'idee d'etre n'importe ou dans la piece et de dire le mot magique, d'un autre côté ca peut aussi gener les autre personnes autour de moi d'entendre la réponse du nas sur les enceinte, la TV ou tout autre device.

Donnez moi votre avis et mettez moi a contribution sans soucis.

Encore bravo

Diaoul · le 29 décembre 2011

A vrai dire, peu importe l'input et l'output dans Dobby, c'est entièrement paramètrable grace à portaudio et speech-dispatcher.

Le fichier de config est là pour ça.

Comme je disais, dans les Event levés par les Triggers (comme le Clapper), je vais intégrer le numéro de la source audio (micro) utilisée. Comme ça on pourra faire un traitement spécifique selon la source dans les Actions.

Par contre ce qu'il ne sera pas possible de faire avec le design actuel de Dobby c'est l'écoute et la réponse à plusieurs personnes simultanément. Dans ce cas le mieux ce sera de lancer plusieurs Dobby et plusieurs Julius.

Diaoul · le 29 décembre 2011

Ca me fait penser qu'en fait avec un micro blutooth attaché à la chemise ou une oreillette + micro à l'oreille, on résoudrait certainement les problèmes de Sp@ro sur la qualité du microphone en fonction de la distance !

De mon coté j'ai contacté http://www.acousticmagic.com pour savoir s'il m'était possible d'essayer un de leurs produits quelques jours afin de voir si le résultat est correct pour une utilisation 100% autonome.

J'ai pas à ma disposition de clé USB blutooth et je ne sais même pas si ce sera reconnu par Syno. Quelqu'un a-t-il la possibilité de tester ? Ca peut valoir le coup (et même le coût).

Remylpat · le 29 décembre 2011

j'ai une clé usb bluetooth et je dois avoir un micro/casque bluetooth aussi. Je peux bien tester tout ca la semaine prochaine si vous le voulez. par contre faudrait juste me guider pour l'installation

j'ai deja vu dans un forum parler d'un package "bluez" pour bluetooth il me semble. je retrouve mon dongle bluetooth j'install sur mon syno les ipkg et je vous dis si ca detecte qqc des lundi.

En // comment je fait tourner tout ton travail diaoul sur mon DS109 ?

Remylpat · le 29 décembre 2011

Voila les packages dispo pour le bluetooth via ipkg. Ca vous parle a vous ?

Package I-Ver P-Ver Comment install bluez-hcidump 1.42-1 Bluetooth packet analyzer. install bluez-libs 3.36-1 Bluetooth libraries. install bluez-utils 3.36-3 Bluetooth utilities. install bluez2-libs 2.25-1 Bluetooth libraries. install bluez2-utils 2.25-6 Bluetooth utilities. install py-bluez 0.9.2-1 Python wrappers around bluez. install py25-bluez 0.9.2-1

Python wrappers around bluez.

PiwiLAbruti · le 29 décembre 2011

De mon coté j'ai contacté http://www.acousticmagic.com pour savoir s'il m'était possible d'essayer un de leurs produits quelques jours afin de voir si le résultat est correct pour une utilisation 100% autonome.

À $250 le ticket d'entrée, ça calme un peu quand même.

Diaoul · le 29 décembre 2011

j'ai une clé usb bluetooth et je dois avoir un micro/casque bluetooth aussi. Je peux bien tester tout ca la semaine prochaine si vous le voulez. par contre faudrait juste me guider pour l'installation

j'ai deja vu dans un forum parler d'un package "bluez" pour bluetooth il me semble. je retrouve mon dongle bluetooth j'install sur mon syno les ipkg et je vous dis si ca detecte qqc des lundi.

En // comment je fait tourner tout ton travail diaoul sur mon DS109 ?

C'est loin d'être prêt pour un utilisateur. Eventuellement un power user qui n'a pas peur de mettre les mains dans le cambouis.

Ce que tu peux juste faire c'est voir si c'est reconnu sur ton Syno en bidouillant un peu.

À $250 le ticket d'entrée, ça calme un peu quand même.

Ca dépend, si c'est la solution ultime qui marche à la perfection, pourquoi pas. Et puis d'occasion ou un modèle équivalent chez la concurence ça doit se trouver.

Remylpat · le 29 décembre 2011

Je sais pas si je peux me considérer comme PowerUser mais je suis pas trop mal cablé et mon diplome d'ingé en informatique ne remonte pas a si loin ;-p

C'est côté linux que je seche un peu.

J'ai commencé a me documenter sur la partie bluetooth et j'ai hate de me remettre devant mon syno pour apairer une oreillette.J'ai trouvé qq bonnes pistes sur les QNAPs qui vont me servir de base.

Pour ce qui est de la partie Dobby je veux bien bidouiller mais comment je repars de ton github ou de qq chose d'autre ?

Diaoul · le 29 décembre 2011

Y'a rien qui marche sur GitHub pour l'instant

D'ailleurs, dans mon SPK de test j'ai même pas essayé pyaudio (portaudio sur Python). Je fais ça sur mon PC pour l'instant.

Quand quelque chose sera prêt vous serez les premiers à savoir

Diaoul · le 29 décembre 2011

Pour ceux que ça intéresse de faire des essais, le retour de acousticmagic :

Thank you for your interest in Acoustic Magic.

The Voice Tracker™ has been used successfully for voice control.

See: http://www.acousticmagic.com/user-comments.html#ccrosby

Our process for evaluation is for you to buy a Voice Tracker™, and we give you a full refund (excluding shipping) when you return it within 30 days.

Regards

Diaoul · le 30 décembre 2011

Un SPK de test est dispo ici : http://syno.diaoul.fr/SPKs/hastation

La procédure d'installation est simple :

Installer le SPK
Crééer un groupe d'utilisateur "audio" et mettre "root" dedans en éditant /etc/group

Il y a tout ce qu'il faut dedans, y comprit pyaudio pour faire tourner le clapper sur son Syno.

/usr/local/hastation/

Modifié le 30 décembre 2011 par Diaoul

Remylpat · le 31 décembre 2011

Salut Diaoul je test tout ca lundi et te fais un retour

Bon reveillon a tous

Remylpat · le 1 janvier 2012

Salut Diaoul,

Finalement je suis rentré un peu plus tot et je n'ai pas pu m'empecher d'installer ton spk.

Pour l'install tout c'est passé nickel.

J'ai bien créé le group et mis root dedans

J'ai bien qq repertoires (bin,include,openssl.cnf,share,etc,lib,sbin) dans /usr/local/hastation.

Je n'ai par contre pas trouvé de daemon a lancer ou quoi que ce soit me permettant de "runner" le prg. J'ai omis qqc ? Enfin je n'ai pas trouvé non plus ou se cachait le clappeur.

Je regarderais un peu plus demain.

Bonne nuit a tous

Diaoul · le 2 janvier 2012

Je t'ai dis qu'il n'y a pas de programme pour l'instant. C'est juste un tas de binaire cross-compilés pour bidouiller.

julius pour la reconnaissance vocale
espeak et flite pour le TTS
speech-dispatcher
python 2.7 avec les modules pyaudio et speechd

Si tu veux tu peux regarder les documentations de ces binaires et t'amuser avec. Il n'y a pas et n'y aura pas de programme tout fait dans ce SPK avant longtemps et ne t'en fais pas tu ne pourras pas le louper.

Remylpat · le 3 janvier 2012

Salut a tous,

Je commence a faire des tests avec les différents binaires de Diaoul, mais je rencontre un pb ave le micro.

J'ai une carte son terratec avec Line input intégré.

Pour identifier mon micro je fait ffmpeg -f oss -i /dev/dsp4 test.wav (methode Sp@ro)

J'ai bien mon micro de la carte son Terratec en /dev/dsp4 mais aucun son ne s'enregistre.

Lorque je lance alsamixer et que je unmute mon micro, j'entends bien le son dans mes HPs donc le micro fonctionne bien.

J'ai donc essayé de brancher ma camera USB comme vous. Le micro est detecté en /dev/dsp5 et si je fais un ffmpeg -f oss -i /dev/dsp5 test.wav j'ai bien ma voix recordé par mon micro de camera.

Vous n'auriez pas une idée sur comment activer l'entrée mic de ma carte USB ou d'ou cela pourrait provenir ?

Diaoul · le 3 janvier 2012

Essaye ce script pour lister tes devices :


import pyaudio

pa = pyaudio.PyAudio()

for i in range(pa.get_device_count()):

	print repr(pa.get_device_infos_by_index(i))

Pas sûr de la syntaxe des fonctions appelées, regarde la doc de pyaudio.

Modifié le 3 janvier 2012 par Diaoul

Remylpat · le 3 janvier 2012

Ca commence fort :

./inputdevice.py

Traceback (most recent call last):

File "./inputdevice.py", line 2, in <module> import pyaudio

OUPS

Diaoul · le 3 janvier 2012

:facepalm:

/usr/local/hastation/bin/python inputdevice.py

Remylpat · le 3 janvier 2012

Voila l'output mais je t'avoue j'ai un peu du mal

ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.rear

ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.center_lfe

ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.side

ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.hdmi

ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.modem

ALSA lib pcm.c:2212:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.phoneline

ALSA lib pcm_dsnoop.c:612:(snd_pcm_dsnoop_open) unable to open slave

ALSA lib pcm_dmix.c:957:(snd_pcm_dmix_open) The dmix plugin supports only playback stream

Traceback (most recent call last):

File "inputdevice.py", line 5, in <module>

print repr(pa.get_device_infos_by_index(i))

AttributeError: PyAudio instance has no attribute 'get_device_infos_by_index'

si je fais un lsusb j'ai


DiskStation> lsusb

Bus 001 Device 004: ID 046d:08c7 Logitech, Inc.

Bus 001 Device 003: ID 0ccd:0077 TerraTec Electronic GmbH

Bus 001 Device 002: ID 05e3:0608 Genesys Logic, Inc. USB-2.0 4-Port HUB

Bus 001 Device 001: ID 1d6b:0002

Modifié le 3 janvier 2012 par Remylpat

Connexion

Tts Sur Son Nas

Messages recommandés

Diaoul

Meilleurs contributeurs dans ce sujet

Jours populaires

Meilleurs contributeurs dans ce sujet

Jours populaires

Remylpat

Diaoul

Diaoul

Sp@r0

Diaoul

Remylpat

Diaoul

Diaoul

Remylpat

Remylpat

PiwiLAbruti

Diaoul

Remylpat

Diaoul

Diaoul

Diaoul

Remylpat

Remylpat

Diaoul

Remylpat

Diaoul

Remylpat

Diaoul

Remylpat

Rejoindre la conversation

Qui est en ligne 1 membre, 0 anonyme, 158 invités (Afficher la liste complète)

Contributeurs populaires

Annonces

Forum

Discussions

Articles

Information importante