Como fazer um teste T no Excel

Índice:

Como fazer um teste T no Excel
Como fazer um teste T no Excel
Anonim

Um teste T é uma maneira de decidir se há diferenças estatisticamente significativas entre os conjuntos de dados, usando uma distribuição t de Student. O T-Test no Excel é um teste T de duas amostras que compara as médias de duas amostras. Este artigo explica o que significa significância estatística e mostra como fazer um teste T no Excel.

As instruções neste artigo se aplicam ao Excel 2019, 2016, 2013, 2010, 2007; Excel para Microsoft 365 e Excel Online.

Image
Image

O que é significância estatística?

Imagine que você quer saber qual dos dois dados dará uma pontuação melhor. Você rola o primeiro dado e obtém um 2; você rola o segundo dado e obtém um 6. Isso lhe diz que o segundo dado geralmente dá pontuações mais altas? Se você respondeu “Claro que não”, então você já tem alguma compreensão da significância estatística. Você entende que a diferença foi devido à mudança aleatória na pontuação, cada vez que um dado é lançado. Como a amostra era muito pequena (apenas um rolo), ela não mostrou nada significativo.

Agora imagine que você joga cada dado 6 vezes:

  • O primeiro dado rola 3, 6, 6, 4, 3, 3; Média=4,17
  • O segundo dado rola 5, 6, 2, 5, 2, 4; Média=4,00

Isso agora prova que o primeiro dado dá pontuações mais altas que o segundo? Provavelmente não. Uma amostra pequena com uma diferença relativamente pequena entre as médias torna provável que a diferença ainda se deva a variações aleatórias. À medida que aumentamos o número de jogadas de dados, torna-se difícil dar uma resposta de bom senso à pergunta - a diferença entre as pontuações é resultado de variação aleatória ou é realmente mais provável que uma dê pontuações mais altas que a outra?

Significância é a probabilidade de que uma diferença observada entre amostras se deva a variações aleatórias. A significância é muitas vezes chamada de nível alfa ou simplesmente 'α'. O nível de confiança, ou simplesmente 'c', é a probabilidade de que a diferença entre as amostras não se deva à variação aleatória; em outras palavras, que há uma diferença entre as populações subjacentes. Portanto: c=1 – α

Podemos definir 'α' em qualquer nível que quisermos, para nos sentirmos confiantes de que provamos significância. Muitas vezes é usado α=5% (95% de confiança), mas se quisermos ter certeza de que as diferenças não são causadas por variação aleatória, podemos aplicar um nível de confiança mais alto, usando α=1% ou mesmo α=0,1 %.

Vários testes estatísticos são usados para calcular a significância em diferentes situações. Os testes T são usados para determinar se as médias de duas populações são diferentes e os testes F são usados para determinar se as variâncias são diferentes.

Por que testar a significância estatística?

Ao comparar coisas diferentes, precisamos usar testes de significância para determinar se uma é melhor que a outra. Isso se aplica a muitos campos, por exemplo:

  • Nos negócios, as pessoas precisam comparar diferentes produtos e métodos de marketing.
  • Nos esportes, as pessoas precisam comparar diferentes equipamentos, técnicas e competidores.
  • Na engenharia, as pessoas precisam comparar diferentes designs e configurações de parâmetros.

Se você quiser testar se algo tem um desempenho melhor do que outra coisa, em qualquer campo, você precisa testar a significância estatística.

O que é uma distribuição T do aluno?

A distribuição t de Student é semelhante a uma distribuição normal (ou gaussiana). Ambas são distribuições em forma de sino com a maioria dos resultados próximos à média, mas alguns eventos raros estão bem longe da média em ambas as direções, chamados de caudas da distribuição.

A forma exata da distribuição t de Student depende do tamanho da amostra. Para amostras de mais de 30 é muito semelhante à distribuição normal. À medida que o tamanho da amostra é reduzido, as caudas ficam maiores, representando o aumento da incerteza resultante de fazer inferências com base em uma amostra pequena.

Como fazer um teste T no Excel

Antes de aplicar um teste T para determinar se há uma diferença estatisticamente significativa entre as médias de duas amostras, você deve primeiro realizar um teste F. Isso ocorre porque diferentes cálculos são realizados para o teste T, dependendo se há uma diferença significativa entre as variâncias.

Você precisará do suplemento Analysis Toolpak habilitado para realizar esta análise.

Verificando e carregando o suplemento do Analysis Toolpack

Para verificar e ativar o Analysis Toolpak siga estes passos:

  1. Selecione a guia FILE >selecione Options.

  2. Na caixa de diálogo Options, selecione Add-Ins nas abas do lado esquerdo.
  3. Na parte inferior da janela, selecione o menu suspenso Gerenciar e selecione Excel Add-ins. Selecione Go.

    Image
    Image
  4. Certifique-se de que a caixa de seleção ao lado de Pacote de ferramentas de análise esteja marcada e selecione OK.
  5. O Analysis Toolpak está agora ativo e você está pronto para aplicar F-Tests e T-Tests.

Realizando um F-Test e um T-Test no Excel

  1. Digite dois conjuntos de dados em uma planilha. Neste caso, estamos considerando as vendas de dois produtos durante uma semana. O valor médio diário de vendas de cada produto também é calculado, juntamente com seu desvio padrão.

    Image
    Image
  2. Selecione a guia Dados > Análise de Dados

    Image
    Image
  3. Selecione F-Test Two-Sample for Variances da lista e selecione OK.

    Image
    Image

    O Teste F é altamente sensível à não normalidade. Portanto, pode ser mais seguro usar um teste de Welch, mas isso é mais difícil no Excel.

  4. Selecione o Intervalo da Variável 1 e o Intervalo da Variável 2; defina o Alfa (0,05 dá 95% de confiança); selecione uma célula para o canto superior esquerdo da saída, considerando que isso preencherá 3 colunas e 10 linhas. Selecione OK.

    Image
    Image

    Para a Faixa de Variável 1, deve-se selecionar a amostra com o maior desvio padrão (ou variância).

  5. Veja os resultados do F-Test para determinar se há uma diferença significativa entre as variâncias. Os resultados fornecem três valores importantes:

    • F: A razão entre as variâncias.
    • P(F<=f) one-tail: A probabilidade de que a variável 1 não tenha na verdade uma variância maior que a variável 2. Se for maior que alfa, qual é geralmente 0,05, então não há diferença significativa entre as variâncias.
    • F Unicaudal crítico: O valor de F que seria necessário para dar P(F<=f)=α. Se este valor for maior que F, isso também indica que não há diferença significativa entre as variâncias.

    P(F<=f) também pode ser calculado usando a função FDIST com F e os graus de liberdade para cada amostra como suas entradas. Graus de liberdade é simplesmente o número de observações em uma amostra menos um.

  6. Agora que você sabe se há uma diferença entre as variâncias, você pode selecionar o T-Test apropriado. Selecione a guia Data > Análise de dados e, em seguida, selecione Teste t: Duas amostras assumindo variações iguaisou Teste t: Duas amostras assumindo variâncias desiguais

    Image
    Image
  7. Independentemente de qual opção você escolheu na etapa anterior, será apresentada a mesma caixa de diálogo para inserir os detalhes da análise. Para começar, selecione os intervalos que contêm as amostras para Variable 1 Range e Variable 2 Range.

    Image
    Image
  8. Supondo que você não queira testar a diferença entre as médias, defina a Diferença Média Hipotetizada como zero.
  9. Defina o nível de significância Alfa (0,05 dá 95% de confiança), e selecione uma célula para o canto superior esquerdo da saída, considerando que esta preencherá 3 colunas e 14 linhas. Selecione OK.
  10. Reveja os resultados para decidir se há uma diferença significativa entre as médias.

    Assim como no teste F, se o valor p, neste caso P(T<=t), for maior que alfa, então não há diferença significativa. No entanto, neste caso, há dois valores de p dados, um para um teste unicaudal e outro para um teste bicaudal. Nesse caso, use o valor bicaudal, pois qualquer variável com uma média maior seria uma diferença significativa.

Recomendado: