Critérios e métodos para testar hipóteses estatísticas, exemplos

Índice:

Critérios e métodos para testar hipóteses estatísticas, exemplos
Critérios e métodos para testar hipóteses estatísticas, exemplos
Anonim

Teste de hipóteses é um procedimento necessário em estatística. Um teste de hipótese avalia duas afirmações mutuamente exclusivas para determinar qual afirmação é melhor suportada pelos dados da amostra. Quando um achado é considerado estatisticamente significativo, é devido a um teste de hipótese.

Métodos de verificação

Métodos para testar hipóteses estatísticas são métodos de análise estatística. Normalmente, dois conjuntos de estatísticas são comparados ou um conjunto de dados amostrado é comparado com um conjunto de dados sintéticos de um modelo idealizado. Os dados devem ser interpretados de forma a agregar novos significados. Você pode interpretá-los assumindo uma certa estrutura do resultado final e usando métodos estatísticos para confirmar ou rejeitar a suposição. A suposição é chamada de hipótese, e os testes estatísticos usados para esse fim são chamados de hipóteses estatísticas.

H0 e H1 hipóteses

Existem doisos conceitos de teste estatístico de hipóteses - as chamadas "hipótese principal ou nula" e "hipótese alternativa". Elas também são chamadas de hipóteses de Neyman-Pearson. A suposição do teste estatístico é chamada de hipótese nula, a hipótese principal ou H0 para abreviar. É muitas vezes referido como a suposição padrão ou a suposição de que nada mudou. Uma violação de suposição de teste é muitas vezes referida como a primeira hipótese, hipótese alternativa ou H1. H1 é uma abreviação de alguma outra hipótese, porque tudo o que sabemos sobre ela é que os dados H0 podem ser descartados.

teste de hipótese nula
teste de hipótese nula

Antes de rejeitar ou não a hipótese nula, o resultado do teste deve ser interpretado. Uma comparação é considerada estatisticamente significativa se for improvável que a relação entre os conjuntos de dados seja a implementação da hipótese nula de acordo com a probabilidade limite - o nível de significância. Há também critérios de adequação para testes estatísticos de hipóteses. Este é o nome do critério de teste de hipótese, que está associado à suposta lei da distribuição desconhecida. Esta é uma medida numérica da discrepância entre as distribuições empíricas e teóricas.

Procedimento e critérios para testar hipóteses estatísticas

Os métodos de seleção de hipóteses mais comuns são baseados no critério de informação de Akaike ou no coeficiente Bayesiano. O teste estatístico de hipóteses é uma técnica chave tanto na inferência quanto na inferência bayesiana, embora os dois tipos tenham diferenças notáveis. Testes de hipóteses estatísticasdefinir um procedimento que controle a probabilidade de decidir erroneamente sobre um default incorreto ou uma hipótese nula. O procedimento é baseado na probabilidade de funcionar. Essa probabilidade de tomar uma decisão errada é a improbabilidade de que a hipótese nula seja verdadeira e que não exista nenhuma hipótese alternativa particular. O teste não pode mostrar se é verdadeiro ou falso.

Métodos para testar hipóteses estatísticas
Métodos para testar hipóteses estatísticas

Métodos alternativos da teoria da decisão

Existem métodos alternativos de teoria da decisão, nos quais as hipóteses nula e primeira são consideradas em pé de igualdade. Outras abordagens de tomada de decisão, como a teoria bayesiana, tentam equilibrar as consequências de más decisões em todas as possibilidades, em vez de se concentrar em uma única hipótese nula. Várias outras abordagens para decidir qual das hipóteses é correta são baseadas nos dados, quais deles têm as propriedades desejadas. Mas o teste de hipóteses é a abordagem dominante para a análise de dados em muitos campos da ciência.

Testando a hipótese estatística

Sempre que um conjunto de resultados difere de outro conjunto, deve-se confiar em testes de hipóteses estatísticos ou testes de hipóteses estatísticos. Sua interpretação requer uma compreensão adequada dos valores-p e valores críticos. Também é importante entender que, independentemente do nível de significância, os testes ainda podem conter erros. Portanto, a conclusão pode não estar correta.

O processo de teste consiste emvários passos:

  1. Uma hipótese inicial está sendo criada para pesquisa.
  2. Hipóteses nulas e alternativas relevantes são indicadas.
  3. Explica suposições estatísticas sobre a amostra no teste.
  4. Determinando qual teste é apropriado.
  5. Selecione o nível de significância e o limite de probabilidade abaixo do qual a hipótese nula será rejeitada.
  6. A distribuição da estatística do teste de hipótese nula mostra os possíveis valores em que a hipótese nula é rejeitada.
  7. Cálculo em andamento.
  8. É tomada a decisão de rejeitar ou aceitar a hipótese nula em favor de uma alternativa.

Existe uma alternativa que usa um valor p.

Exemplos de teste de hipóteses estatísticas
Exemplos de teste de hipóteses estatísticas

Testes de significância

Dados puros não têm uso prático sem interpretação. Em estatística, quando se trata de fazer perguntas sobre dados e interpretar resultados, os métodos estatísticos são usados para garantir a precisão ou a probabilidade das respostas. Ao testar hipóteses estatísticas, essa classe de métodos é chamada de teste estatístico ou teste de significância. O termo “hipótese” é uma reminiscência de métodos científicos, onde hipóteses e teorias são investigadas. Em estatística, um teste de hipótese resulta em uma quantidade dada uma determinada suposição. Ele permite que você interprete se uma suposição é verdadeira ou se foi feita uma violação.

Interpretação estatística dos testes

Testes de hipótesessão usados para determinar quais resultados de pesquisa levarão à rejeição da hipótese nula para um nível de significância predeterminado. Os resultados de um teste de hipótese estatística devem ser interpretados para que o trabalho possa continuar. Existem duas formas comuns de critérios estatísticos de teste de hipóteses. Estes são o valor-p e os valores críticos. Dependendo do critério selecionado, os resultados obtidos devem ser interpretados de forma diferente.

O que é um valor-p

A saída é descrita como estatisticamente significativa ao interpretar o valor-p. Na verdade, este indicador significa a probabilidade de erro se a hipótese nula for rejeitada. Em outras palavras, pode ser usado para nomear um valor que pode ser usado para interpretar ou quantificar um resultado de teste e para determinar a probabilidade de erro na rejeição da hipótese nula. Por exemplo, você pode realizar um teste de normalidade em uma amostra de dados e descobrir que há pouca chance de valores discrepantes. No entanto, a hipótese nula não precisa ser rejeitada. Um teste de hipótese estatística pode retornar um valor p. Isso é feito comparando o valor de p com um valor limite predeterminado chamado nível de significância.

Teste estatístico de hipóteses nulas
Teste estatístico de hipóteses nulas

Nível de significância

O nível de significância é muitas vezes escrito com a letra minúscula grega "alpha". O valor geral usado para alfa é 5%, ou 0,05. Um valor alfa menor sugere uma interpretação mais confiável da hipótese nula. O valor p é comparado comvalor alfa pré-selecionado. O resultado é estatisticamente significativo se o valor p for menor que alfa. O nível de significância pode ser invertido subtraindo-o de um. Isso é feito para determinar o nível de confiança da hipótese dado os dados da amostra observada. Ao usar este método de teste de hipóteses estatísticas, o valor P é probabilístico. Isso significa que no processo de interpretação do resultado de um teste estatístico, não se sabe o que é verdadeiro ou falso.

Teoria do teste de hipótese estatística

Rejeição da hipótese nula significa que há evidência estatística suficiente de que ela parece provável. Caso contrário, significa que não há estatísticas suficientes para rejeitá-lo. Pode-se pensar em testes estatísticos em termos da dicotomia de rejeitar e aceitar a hipótese nula. O perigo do teste estatístico da hipótese nula é que, se aceita, pode parecer verdadeira. Em vez disso, seria mais correto dizer que a hipótese nula não é rejeitada porque não há evidência estatística suficiente para rejeitá-la.

Critérios de qualidade de teste de hipótese estatística
Critérios de qualidade de teste de hipótese estatística

Este momento muitas vezes confunde os extras novatos. Nesse caso, é importante lembrar que o resultado é probabilístico e que mesmo aceitando a hipótese nula ainda tem uma pequena chance de erro.

Hipótese nula verdadeira ou falsa

Interpretação do valor de p não significa que zeroa hipótese é verdadeira ou falsa. Isso significa que foi feita a escolha de rejeitar ou não a hipótese nula em um determinado nível de significância estatística com base nos dados empíricos e no teste estatístico escolhido. Portanto, o valor-p pode ser pensado como a probabilidade dos dados fornecidos sob uma suposição predeterminada embutida nos testes estatísticos. O valor-p é uma medida da probabilidade de a amostra de dados ser observada se a hipótese nula for verdadeira.

Interpretação de valores críticos

Alguns testes não retornam p. Em vez disso, eles podem retornar uma lista de valores críticos. Os resultados de tal estudo são interpretados de forma semelhante. Em vez de comparar um único valor de p com um nível de significância predeterminado, a estatística de teste é comparada a um valor crítico. Se for menor, significa que não foi possível rejeitar a hipótese nula. Se maior ou igual, a hipótese nula deve ser rejeitada. O significado do algoritmo de teste de hipótese estatística e a interpretação de seu resultado é semelhante ao valor-p. O nível de significância escolhido é uma decisão probabilística de rejeitar ou não a suposição base do teste dado os dados.

Erros em testes estatísticos

A interpretação de um teste de hipótese estatística é probabilística. A tarefa de testar hipóteses estatísticas não é encontrar uma afirmação verdadeira ou falsa. A evidência do teste pode ser errônea. Por exemplo, se o alfa foi de 5%, isso significa que, na maior parte, 1 em 20a hipótese nula será rejeitada por engano. Ou não devido ao ruído estatístico na amostra de dados. Dado este ponto, um pequeno valor de p para rejeitar a hipótese nula pode significar que ela é falsa ou que um erro foi cometido. Se esse tipo de erro for cometido, o resultado é chamado de falso positivo. E tal erro é um erro do primeiro tipo ao testar hipóteses estatísticas. Por outro lado, se o valor de p for grande o suficiente para significar a rejeição da hipótese nula, isso pode significar que é verdade. Ou não está correto e ocorreu algum evento improvável devido ao qual o erro foi cometido. Esse tipo de erro é chamado de falso negativo.

Teste estatístico de hipóteses nulas
Teste estatístico de hipóteses nulas

Probabilidade de erros

Ao testar hipóteses estatísticas, ainda há uma chance de cometer qualquer um desses tipos de erros. Dados falsos ou conclusões falsas são bastante prováveis. Idealmente, deve-se escolher um nível de significância que minimize a probabilidade de um desses erros. Por exemplo, testes estatísticos de hipóteses nulas podem ter um nível de significância muito baixo. Embora níveis de significância como 0,05 e 0,01 sejam comuns em muitos campos da ciência, o nível de significância mais comumente usado é 310^-7, ou 0,0000003. É muitas vezes referido como “5-sigma”. Isso significa que a conclusão foi aleatória com probabilidade de 1 em 3,5 milhões de repetições independentes dos experimentos. Exemplos de teste de hipóteses estatísticas muitas vezes carregam esses erros. Esta é também a razão pela qual é importante ter resultados independentes.verificação.

Exemplos de uso da verificação estatística

Existem vários exemplos comuns de testes de hipóteses na prática. Um dos mais populares é conhecido como “Degustação de Chá”. A Dra. Muriel Bristol, colega do fundador da biometria Robert Fisher, afirmou ser capaz de dizer com certeza se ela foi adicionada primeiro a uma xícara de chá ou leite. Fisher se ofereceu para dar a ela oito xícaras (quatro de cada variedade) aleatoriamente. A estatística do teste era simples: contar o número de sucessos na escolha de uma xícara. A região crítica foi o único sucesso de 4, possivelmente com base no critério de probabilidade usual (< 5%; 1 em 70 ≈ 1,4%). Fisher argumentou que uma hipótese alternativa não é necessária. A senhora identificou corretamente cada xícara, o que foi considerado um resultado estatisticamente significativo. Essa experiência levou ao livro de Fisher Statistical Methods for Pesquisadores.

Exemplo do réu

O procedimento de julgamento estatístico é comparável a um tribunal criminal onde o réu é presumido inocente até prova em contrário. O promotor tenta provar a culpa do réu. Somente quando houver provas suficientes para uma acusação, o réu pode ser considerado culpado. No início do procedimento, há duas hipóteses: "O réu não é culpado" e "O réu é culpado". A hipótese de inocência só pode ser rejeitada quando o erro é muito improvável porque não se quer condenar um réu inocente. Tal erro é chamado de erro Tipo I, e sua ocorrênciararamente controlado. Como consequência desse comportamento assimétrico, o erro Tipo II, ou seja, a absolvição do agressor, é mais comum.

Exemplos de validação estatística
Exemplos de validação estatística

As estatísticas são úteis ao analisar grandes quantidades de dados. Isso se aplica igualmente ao teste de hipóteses, que podem justificar as conclusões mesmo que não exista nenhuma teoria científica. No exemplo da degustação de chá, era "óbvio" que não havia diferença entre despejar leite no chá ou despejar chá no leite.

A aplicação prática real do teste de hipóteses inclui:

  • testando se os homens têm mais pesadelos do que as mulheres;
  • atribuição do documento;
  • Avaliando a influência da lua cheia no comportamento;
  • determinando o alcance em que um morcego pode detectar um inseto usando um eco;
  • escolhendo a melhor forma de parar de fumar;
  • Verificando se os adesivos refletem o comportamento do proprietário do carro.

Teste de hipótese estatística desempenha um papel importante na estatística em geral e na inferência estatística. O teste de valor é usado como um substituto para a comparação tradicional de valor previsto e resultado experimental no núcleo do método científico. Quando uma teoria só é capaz de prever o sinal de uma relação, os testes de hipóteses direcionados podem ser configurados de tal forma que apenas um resultado estatisticamente significativo apóie a teoria. Esta forma de teoria da avaliação é a mais rígidacrítica ao uso de testes de hipóteses.

Recomendado: