2006
08.23

Já existe por aí alguns muitos estudos e alguns projetos concretos sobre reconhecimento de voz. Mas aparentemente nada muito estável.

A Intel está com grandes estudos a respeito e inclusive publicou seu software em versão beta com código aberto no sourceforge.net, a IBM deve fazer o mesmo. O que é bom sinal, tecnologias vindas de iniciativas open source costumam resultar em produtos bem mais acessíveis. Por agora existem produtos comerciais meio obscuros, como esse, esse, e alguns outros por aí. Mas as pesquisas com melhor resultado são as que cruzam reconhecimento de voz com leitura labial através de visão computacional.

O W3C definiu uma estrutura padrão para o VoiceXML. Um jeito de armazenar dados a partir de fala e diálogos e formatá-los para que seja possível qualquer tipo de operação semântica aplicável a textos comuns. Isso já vem sendo usado há alguma tempo em serviços como atendimento por telefone.

O que acho interessante é observar como a tecnologia vem finalmente se aproximando de interfaces mais apropriadas para o homem. É cruel que ainda precisemos colocar nossos corpos em funções das máquinas. E também perceber como é sempre a indústria que dá o rumo a seguir. Grandes ferramentas são desenvovidas mas sempre com o mesmo propósito medíocre, aumentar o consumo de produtos descartáveis.

Gostaria de ver projetos de arte se aproveitando dessa tecnologia emergente pra levantar questões sobre nosso relacionamento com as ferramenas que construímos e com toda a informação desconexa que a humanidade produz. Existem algumas coisas bacanas, como o messa di voce, que brincam com o som da voz, mas não chegam a coompreender palavras. Só jogando com possibilidades semânticas um trabalho poderia permitir a interação direta com informações e construção de significado.

Nenhum comentário.

Adicione Seu Comentário