Como o reconhecimento de voz fluente permanece rápido, preciso e privado

Índice:

Como o reconhecimento de voz fluente permanece rápido, preciso e privado
Como o reconhecimento de voz fluente permanece rápido, preciso e privado
Anonim

Princípios importantes

  • Fluent é um mecanismo de reconhecimento de voz super-rápido que respeita a privacidade e não precisa de conexão com a Internet.
  • Pode ser embutido em quase qualquer dispositivo.
  • Funciona em qualquer idioma.
Image
Image

Fluent.ai é um mecanismo de reconhecimento de voz virtual que não envia seus comandos para a Internet, age quase instantaneamente, pode funcionar em qualquer idioma e é tão pequeno que pode ser incorporado em -dispositivos de energia como um relógio de fitness, por exemplo.

Ao contrário do Siri e do Alexa, o Fluent é um assistente independente que entende você instantaneamente e aprende com você, então fica melhor quanto mais você o usa. Ele não tem a profundidade de assistentes virtuais regulares, mas não é para isso. Em vez disso, é mais rápido, mais preciso e mais privado do que os esforços da Apple, Amazon e Google.

"A fala em texto usa processamento de linguagem natural e, em seguida, deriva a intenção", disse o CEO da Fluent, Probal Lala, à Lifewire durante uma entrevista no Zoom. "Requer muitos dados e muito poder de processamento. Fluent vai diretamente da fala para a intenção, pegando sua voz e convertendo-a diretamente em uma ação."

Linha de fundo

Fluent é um software de controle de voz. Ele funciona ouvindo seu comando e removendo todas as palavras que não precisa, deixando apenas substantivos e verbos essenciais. "Apague as luzes", torna-se apenas para fora e luzes. Os elementos essenciais são retirados de uma frase humana confusa e transformados em etapas. É quase como programar um computador, transformando uma ideia complexa no mais simples conjunto de instruções.

Para que serve?

Fluent pode ser usado para qualquer coisa. A chave é que ele é treinado para uma situação específica. Com um relógio inteligente, por exemplo, ele pode ser treinado em comandos para condicionamento físico ou para automação residencial, criação de calendário e cronômetro e assim por diante. Limitar o banco de dados deixa tudo mais focado e rápido.

"A verdade é que com wearables, você não está querendo ter uma conversa", disse Lala, "eu quero que talvez minha rotina de exercícios favorita comece, e quero muito rapidamente."

Velocidade e precisão são o ponto principal. Ligar e desligar as luzes leva milissegundos, em vez de ter que esperar que a Siri envie sua voz para a nuvem, espere que ela seja processada e, segundos depois, as luzes se apaguem.

Este treinamento restrito também reduz o tamanho do aplicativo. No ano passado, o Google forneceu uma versão offline para download de seu assistente. Era, diz Lala, 85 Megabytes, só funcionava em inglês e levou seis meses para treiná-lo.

"Temos um modelo trabalhando com 13.000 comandos e opera em 500 kilobytes", disse ele.

Linha de fundo

A outra vantagem de um mecanismo de reconhecimento de voz offline é a privacidade. No relógio inteligente de uma criança, por exemplo, "você não quer que a voz de uma criança vá para a nuvem", diz Lala. Na verdade, o Fluent pode funcionar dentro de dispositivos que nunca se conectam à Internet. Isso não é bom apenas para a privacidade, mas também para a segurança. Você pode usar um mecanismo de reconhecimento de voz offline dentro de laboratórios de pesquisa, instalações militares e outros lugares que proíbem telefones celulares e câmeras.

Limites

Claro, existem algumas desvantagens neste modelo. Uma é que os comandos não podem ser adicionados posteriormente. Quando o treinamento inicial estiver concluído, é isso. Seu assistente fluente também não pode procurar na internet as pontuações do seu esporte, o ator que você reconhece naquele filme, mas simplesmente não consegue localizar e assim por diante.

Image
Image

Em vez disso, o sistema é inteligente o suficiente para reconhecer quando não pode ajudar e entregará a solicitação para algo que possa. Se você perguntar ao seu relógio a previsão do tempo, o Fluent perceberá que ele não entende. "Em seguida, ele chamará um serviço pré-programado no relógio, seja o Alexa da Amazon ou o Google, e fará uma chamada para a nuvem", passando seu comando de voz bruto para obter a resposta.

Essa abordagem híbrida mantém a velocidade de um assistente local e offline, com o poder do Alexa ou do Google Assistant como backup.

Você pode comprar qualquer dispositivo fluente?

Ainda não. A empresa está licenciando sua tecnologia e fazendo o treinamento para outras empresas. Graças ao COVID, dois grandes lançamentos foram adiados para o próximo ano. Mas você pode esperar que ele apareça em relógios e outros dispositivos de fitness, alto-falantes, hubs de automação residencial e assim por diante.

Seria ótimo se isso também fosse incorporado diretamente em smartphones como o iPhone, tornando as tarefas do dia-a-dia mais rápidas, e recorrendo ao Siri apenas quando necessário. Esse seria o verdadeiro aplicativo matador.

Atualização: 22 de outubro, 10h12. Alterações feitas para se referir ao Fluent como um mecanismo de reconhecimento de voz em vez de um assistente de voz.

Recomendado: