Como usar a ferramenta Ngram Viewer no Google Livros

Índice:

Como usar a ferramenta Ngram Viewer no Google Livros
Como usar a ferramenta Ngram Viewer no Google Livros
Anonim

O que saber

  • No Visualizador Ngram do Google Livros, digite uma frase, escolha um intervalo de datas e um corpus, defina o nível de suavização e clique em Pesquisar muitos livros.
  • Você pode detalhar os dados. Por exemplo, para procurar a forma verbal de peixe, em vez do substantivo peixe, use uma tag: procure por fish_VERB.
  • Ngram Viewer gera um gráfico representando o uso da frase ao longo do tempo. Para várias frases, cada uma é representada por uma linha codificada por cores.

Este artigo explica como usar a ferramenta Ngram Viewer no Google Livros para realizar pesquisas e pesquisas avançadas.

Image
Image

Como funciona o visualizador do Ngram

Um Ngram, também chamado de N-gram, é uma análise estatística do conteúdo do texto ou da fala para encontrar n (um número) de algum tipo de item no texto.

O item de pesquisa pode ser todo tipo de coisa, incluindo fonemas, prefixos, frases e letras. Embora um Ngram seja obscuro fora da comunidade de pesquisa, ele é usado em vários campos e tem muitas implicações para desenvolvedores que estão codificando programas de computador que entendem e respondem à linguagem falada natural.

No caso do Google Books Ngram Viewer, o texto a ser analisado vem do grande número de livros em domínio público que o Google digitalizou para preencher seu mecanismo de busca Google Books. Para o Google Books Ngram Viewer, o Google se refere ao corpo de texto que você vai pesquisar como o corpus. O Ngram Viewer agrega por idioma, embora você possa analisar separadamente o inglês britânico e americano ou agrupá-los.

  1. Vá para o Visualizador Ngram do Google Livros em books.google.com/ngrams.
  2. Digite qualquer frase ou frases que você deseja analisar. Separe cada frase com uma vírgula. O Google sugere "Albert Einstein, Sherlock Holmes, Frankenstein" para você começar.

    Nas pesquisas do NGram Viewer, os itens diferenciam maiúsculas de minúsculas, ao contrário das pesquisas na web do Google.

  3. Selecione um intervalo de datas. O padrão é 1800 a 2000.
  4. Escolha um corpus. Você pode pesquisar textos em idiomas estrangeiros ou textos em inglês e, além das opções padrão, poderá observar entradas como "Inglês (2009)" ou "Inglês americano (2009)" na parte inferior da lista. Esses são corpora mais antigos que o Google atualizou desde então, mas você pode ter algum motivo para fazer suas comparações com conjuntos de dados antigos. A maioria dos usuários pode ignorá-los e se concentrar nos corpora mais recentes.
  5. Defina o nível de suavização. Suavização refere-se a quão suave é o gráfico no final. A representação mais precisa reflete um nível de suavização de 0, mas essa configuração pode ser difícil de ler. O padrão é 3. Na maioria dos casos, você não precisa ajustá-lo.

  6. Pressione Pesquisar muitos livros.

Usando o Ngram Viewer do Google, você pode detalhar os dados. Se você quiser pesquisar pelo verbo fish em vez do substantivo fish, poderá fazê-lo usando tags. Nesse caso, você pesquisaria por fish_VERB.

O Google fornece uma lista completa de comandos e outras documentações avançadas para uso com o Ngram Viewer em seu site.

Linha de fundo

Google Books Ngram Viewer gera um gráfico que representa o uso de uma frase específica em livros ao longo do tempo. Se você inseriu mais de uma palavra ou frase, cada uma será representada por uma linha codificada por cores para contrastar com os outros termos de pesquisa. Isso é semelhante ao Google Trends, apenas a pesquisa abrange um período mais longo.

Estudo de Caso

Considere o estudo de caso de tortas de vinagre. Eles são mencionados na série Little House on the Prairie, de Laura Ingalls Wilder. Explorar com a pesquisa na web do Google para saber mais sobre tortas de vinagre revela que elas são consideradas parte da culinária sul americana e são realmente feitas com vinagre. Eles remontam a tempos em que nem todos tinham acesso a produtos frescos em todas as épocas do ano, mas essa é a história toda?

Pesquise no Google Ngram Viewer por torta de vinagre e você encontrará algumas menções à torta no início e no final dos anos 1800, muitas menções na década de 1940 e um número crescente de menções nos últimos tempos. No entanto, com um nível de suavização de 3, você vê um platô sobre as menções em 1800. Como não havia muitos livros publicados durante esse período e como os dados estão definidos para suavizar, a imagem fica distorcida. Provavelmente apenas um livro mencionou torta de vinagre, e foi calculada a média para evitar um pico. Ao definir a suavização para 0, você pode ver que este é precisamente o caso. O pico está centrado em 1869, e há outro pico em 1897 e 1900.

É improvável que ninguém tenha falado sobre tortas de vinagre o resto do tempo: provavelmente havia receitas flutuando por todo o lugar, mas as pessoas não escreveram sobre elas em livros, e essa é uma limitação importante das pesquisas do Ngram.

Recomendado: