Nome do Tópico
Comentários
Grupo de Robótica Livre do Estado de Goiás
Participe:
http://groups.google.com.br/group/robotica-livre-goias
Por Otávio Calaça Xavier
Inicialmente pensamos em fazer um robo que consiga analisar a frequência do som capitado pelo microfone e saiba "entender" duas palavras: sim e não.
Basicamente o robo também teria um sintetizador de voz e um banco de dados de perguntas que esperem respostas sim ou não.
Algo parecido com o akinator[1], porem para propósito diferente.
No youtube tem um video[2] que mostra uma rede neural, em hardware, capaz de identificar duas silabas: "ca" e "fé".
Para analisar a frequência do áudio capitado pelo microfone, em tempo real, o mais interessante software que achei foi o baudline[3].
Porém, hoje achei alguns softwares mais interessantes e destinados ao que queremos.
Dentre eles posso destacar:
Julius[4] - possui um dicionário de 60k palavras em inglês para reconhecimento, usado como base para outros...
VoxForge?[5] - suporta palavras de outros idiomas alem do inglês.
CMU Sphinx[6] - Já foi usado em robo.
HTK[7] - Software desenvolvido pela Microsoft com código fonte aberto. Reconhece outros padrões, além de sonoros.
Open Mind Speech[8]
GnomeVoiceControl?[9] - Desenvolvido para realizar alguns comandos no gnome através da voz.
Simon[10] - baseado no julius, criado para auxiliar cegos.
Bom, consegui encontrar um video no youtube demonstrando o funcionamento do
GnomeVoiceControl?[11] e outro mostrando um robo controlado por voz usando o CMU Sphinx[12], esse eu achei muito massa, acredito que se conseguíssemos fazer algo parecido seria muito bom!
Temos qual avaliar qual desses softwares é mais leve e mais adequado para colocar em um robo.
Vale a pena mostrar um robozinho da lego[13] e um video com ele adaptado para resolver o famoso cubo mágico[14].
--
[1]
http://en.akinator.com/
[2]
http://www.youtube.com/watch?v=1TEz7LRHKXo
[3]
http://www.dxzone.com/cgi-bin/dir/jump2.cgi?ID=12522
[4]
http://julius.sourceforge.jp/en_index.php
[5]
http://www.voxforge.org/
[6]
http://cmusphinx.sourceforge.net/html/cmusphinx.php
[7]
http://htk.eng.cam.ac.uk/
[8]
http://freespeech.sourceforge.net/
[9]
http://live.gnome.org/GnomeVoiceControl
[10]
http://simon-listens.org/
[11]
http://www.youtube.com/watch?v=GCSgkUnlGGA
[12]
http://www.youtube.com/watch?v=f4LUBX6mwBk
[13]
http://produto.mercadolivre.com.br/MLB-85352067-_JM
[14]
http://www.ovelho.com/content/resolvendo-o-cubo-de-rubik
--