Como funciona o recurso Hum to Search do Google

Índice:

Como funciona o recurso Hum to Search do Google
Como funciona o recurso Hum to Search do Google
Anonim

Princípios importantes

  • O Google lançou uma nova ferramenta que permite aos usuários pesquisar músicas cantarolando, cantando ou assobiando.
  • A nova ferramenta usa aprendizado de máquina para combinar uma faixa zumbida com um banco de dados de mais de meio milhão de músicas que é continuamente atualizado.
  • Os usuários do Google perguntam qual música está tocando quase 100 vezes por mês.
Image
Image

O Google lançou um novo recurso chamado "Hum to Search" para resolver um problema frustrante: ter uma música presa na cabeça e não conseguir descobrir como ela se chama.

A ideia de cantarolar para encontrar uma música parece incrivelmente simples, então por que o Google está lançando esse recurso apenas em 2020? Bem, acontece que identificar músicas dessa maneira é realmente muito complicado, em parte porque nossas versões cantaroladas tendem a ser bem diferentes da faixa original. Em uma postagem recente em seu blog de IA, o Google explica como usou o aprendizado de máquina para corrigir esse problema e, em última análise, ajudar as pessoas a encontrar uma música cantarolando, assobiando ou cantando a melodia, mesmo quando sua interpretação não é tão precisa.

"Nosso foco para o Hum to Search é ajudar as pessoas a identificar e encontrar músicas que estão presas em suas cabeças", disse um porta-voz do Google à Lifewire por e-mail.

Comece a cantarolar

Os usuários do Google perguntam qual música está tocando quase 100 milhões de vezes por mês, Aparna Chennapragada, vice-presidente do Google e gerente geral de compras do consumidor, disse que um vídeo apresenta vários novos recursos de pesquisa. Agora há uma maneira de descobrir.

O recurso "Hum to Search" está integrado ao aplicativo móvel do Google, ao widget de pesquisa do Google e ao Google Assistant. Para acessá-la pelo aplicativo, toque no ícone do microfone e diga "O que é essa música?" Selecionar o botão "Pesquisar uma música" também funciona.

Para funcionar corretamente, o recurso requer que você sussurre por pelo menos 10-15 segundos. Os usuários do Android podem cantarolar para encontrar músicas em mais de 20 idiomas, enquanto apenas as músicas em inglês funcionam nos iPhones. A ferramenta nem sempre consegue identificar uma música imediatamente, mas quando o faz, os resultados são muito bons.

"Mais da metade das músicas de um amplo conjunto de variáveis (tom, tom, volume, etc.) a música e muito mais", disse o porta-voz do Google à Lifewire por e-mail. "Mas uma vez reconhecido, aproximadamente quatro em cada cinco respostas estão corretas."

Esta não é a primeira vez que o zumbido é usado em um aplicativo de identificação de música. O SoundHound oferece um recurso semelhante, conforme observado pela CNN Business, e também está disponível no Android e iOS. De acordo com o porta-voz do Google, o novo recurso não levanta preocupações de privacidade, nem "muda a maneira como o Google lida com interações baseadas em áudio", disseram eles à Lifewire por e-mail.

Aprendizado de Máquina

Apesar da simplicidade do conceito, cantarolar uma música para encontrar a gravação em estúdio é tecnicamente muito difícil. Existem várias razões para isso, explica Christian Frank, do Google Research, em uma postagem no blog de 12 de novembro. Em primeiro lugar, uma versão cantarolada da música pode diferir muito da gravação real, tornando difícil combinar as duas. Portanto, embora o Shazam e vários outros aplicativos já existam para identificar a música que você ouve em um restaurante ou outro local público, usar uma melodia zumbida como base para essa pesquisa pode ser mais complicado.

"Com letras, vocais de fundo e instrumentos, o áudio de uma gravação musical ou de estúdio pode ser bem diferente de uma melodia cantarolada", escreve Frank."Por engano ou design, quando alguém cantarola sua interpretação de uma música, geralmente o tom, a tonalidade, o andamento ou o ritmo podem variar um pouco ou até significativamente."

Image
Image

Como as versões cantaroladas das músicas podem ser muito diferentes das originais, Frank observa que muitos métodos passados exigiam combinar o zumbido de uma pessoa com uma versão da música que só tem uma melodia ou uma faixa que inclui zumbido. Isso tornou os casos de uso do mundo real desafiadores, pois os bancos de dados com essas músicas podem ser limitados e precisam ser atualizados manualmente.

O Google explica que, para o recurso Hum to Search, ele usa modelos de aprendizado de máquina para transformar o áudio em uma "sequência baseada em números" que representa a melodia da música - o que ele diz pode ser considerado uma "impressão digital."

Mais fácil de usar

O uso de aprendizado de máquina no recurso Hum to Search do Google torna a ferramenta muito mais fácil de usar no mundo real. Como o Hum to Search combina a melodia zumbida do pesquisador com a música real, a ferramenta é capaz de trabalhar com as novas músicas à medida que são lançadas, em vez de um banco de dados que precisa ser constantemente atualizado com versões zumbidas de cada faixa. Além disso, você não precisa de um tom perfeito para usá-lo.

"O sistema atual atinge um alto nível de precisão em um banco de dados de músicas que contém mais de meio milhão de músicas que estamos atualizando continuamente", disse o Google em seu anúncio Hum to Search. "Este corpus de músicas ainda tem espaço para crescer para incluir mais das muitas melodias do mundo."

Recomendado: