Princípios importantes
- Pesquisadores criaram um método para embaralhar conversas para impedir que microfones desonestos capturem nossas conversas.
- O método é significativo, pois funciona em tempo real em streaming de áudio e com treinamento mínimo.
- Especialistas aplaudem a pesquisa, mas acham que não é de muita utilidade para o usuário médio de smartphone.
Estamos cercados por dispositivos inteligentes com microfones, mas e se eles foram comprometidos para nos espionar?
Em um esforço para proteger nossas conversas de bisbilhoteiros, pesquisadores da Universidade de Columbia desenvolveram um método Neural Voice Camouflage que interrompe os sistemas de reconhecimento automático de fala em tempo real sem incomodar as pessoas.
"Com a invasão de [dispositivos inteligentes ativados por voz] em nossas vidas, a ideia de privacidade começa a evaporar, pois esses dispositivos de escuta estão sempre ligados e monitorando o que está sendo dito", Charles Everette, Diretor de Defesa Cibernética, Deep Instinct, disse à Lifewire por e-mail. "Esta pesquisa é uma resposta direta à necessidade de ocultar ou camuflar a voz e as conversas de um indivíduo desses bisbilhoteiros eletrônicos, conhecidos ou desconhecidos em uma área."
Conversando
Os pesquisadores desenvolveram um sistema que gera sons silenciosos que você pode tocar em qualquer sala para impedir que microfones desonestos espionem suas conversas.
A forma como esse tipo de tecnologia se opõe à espionagem lembra Everette dos fones de ouvido com cancelamento de ruído. Em vez de gerar sons silenciosos para cancelar o ruído de fundo, os pesquisadores transmitem sons de fundo que interrompem os algoritmos de Inteligência Artificial (IA) que interpretam ondas sonoras em áudio compreensível.
Esses mecanismos para camuflar a voz de uma pessoa não são exclusivos, mas o que diferencia a Camuflagem de Voz Neural dos outros métodos é que ela funciona em tempo real no streaming de áudio.
"Para operar em fala ao vivo, nossa abordagem deve prever [o áudio codificado correto] no futuro para que possam ser reproduzidos em tempo real ", observam os pesquisadores em seu artigo. Atualmente, o método funciona para a maioria do idioma inglês.
Hans Hansen, CEO da Brand3D, disse à Lifewire que a pesquisa é muito significativa, pois ataca uma grande fraqueza nos sistemas de IA atuais.
Em uma conversa por e-mail, Hansen explicou que os atuais sistemas de IA de aprendizado profundo em geral e o reconhecimento natural de fala em particular funcionam após o processamento de milhões de registros de dados de fala coletados de milhares de falantes. Em contraste, a Camuflagem de Voz Neural funciona depois de se condicionar a apenas dois segundos de fala de entrada.
Pessoalmente, se estou preocupado com dispositivos de escuta, minha solução não seria adicionar outro dispositivo de escuta que busque gerar ruído de fundo.
Árvore errada?
Brian Chappell, estrategista-chefe de segurança da BeyondTrust, acredita que a pesquisa é mais benéfica para usuários corporativos que temem estar no meio de dispositivos comprometidos que estão ouvindo palavras-chave que indicam que informações valiosas estão sendo faladas.
"Onde essa tecnologia seria potencialmente mais interessante é em um estado de vigilância mais autoritário, onde a análise de impressão de voz e vídeo de IA é usada contra os cidadãos", disse James Maude, pesquisador líder de segurança cibernética da BeyondTrust, à Lifewire por e-mail.
Maude sugeriu que uma alternativa melhor seria implementar controles de privacidade sobre como os dados são capturados, armazenados e usados por esses dispositivos. Além disso, Chappell acredita que a utilidade do método do pesquisador é limitada, pois não foi projetado para impedir a espionagem humana.
"Para a casa, tenha em mente que, pelo menos em teoria, usar essa ferramenta fará com que Siri, Alexa, Google Home e qualquer outro sistema ativado com uma palavra-gatilho falada ignore você ", disse Chappell.
Mas os especialistas acreditam que, com a crescente inclusão de tecnologia específica de IA/ML em nossos dispositivos inteligentes, é perfeitamente possível que essa tecnologia acabe dentro de nossos telefones em um futuro próximo.
Maude está preocupada, pois as tecnologias de IA podem aprender rapidamente a diferenciar entre ruído e áudio real. Ele acha que, embora o sistema possa ser bem-sucedido inicialmente, ele pode rapidamente se transformar em um jogo de gato e rato, pois um dispositivo de escuta aprende a filtrar os ruídos de interferência.
Mais preocupante, Maude apontou que qualquer um que o use poderia, de fato, chamar a atenção para si mesmo, pois interromper o reconhecimento de voz pareceria incomum e poderia indicar que você está tentando esconder algo.
"Pessoalmente, se estou preocupado com dispositivos de escuta, minha solução não seria adicionar outro dispositivo de escuta que busca gerar ruído de fundo ", compartilhou Maude. "Especialmente porque isso aumenta o risco de um dispositivo ou aplicativo ser hackeado e capaz de me ouvir."