O que é a lei de distribuição de Pearson? A resposta a esta ampla pergunta não pode ser simples e concisa. O sistema Pearson foi originalmente projetado para modelar observações distorcidas visíveis. Na época, era bem conhecido como ajustar um modelo teórico para corresponder aos dois primeiros cumulantes ou momentos de dados observados: qualquer distribuição de probabilidade pode ser expandida diretamente para formar um grupo de escalas de localização.
Hipótese de Pearson sobre a distribuição normal dos critérios
Exceto em casos patológicos, a escala de localização pode ser feita para corresponder à média observada (primeiro cumulante) e variância (segundo cumulante) de maneira arbitrária. No entanto, não se sabia como construir distribuições de probabilidade nas quais a assimetria (terceiro cumulante padronizado) e a curtose (quarto cumulante padronizado) pudessem ser controladas igualmente livremente. Essa necessidade tornou-se aparente ao tentar ajustar os modelos teóricos conhecidos aos dados observados,que mostrou assimetria.
No vídeo abaixo você pode ver a análise da distribuição chi de Pearson.
Histórico
Em seu trabalho original, Pearson identificou quatro tipos de distribuições (numeradas de I a IV) além da distribuição normal (que era originalmente conhecida como tipo V). A classificação depende se as distribuições são suportadas em um intervalo limitado, em um semi-eixo ou em toda a linha real, e se elas eram potencialmente assimétricas ou necessariamente simétricas.
Duas omissões foram corrigidas no segundo artigo: ele redefiniu a distribuição tipo V (originalmente era apenas a distribuição normal, mas agora com gama inversa) e introduziu a distribuição tipo VI. Juntos, os dois primeiros artigos abrangem os cinco principais tipos do sistema Pearson (I, III, IV, V e VI). No terceiro artigo, Pearson (1916) introduziu subtipos adicionais.
Melhorar o conceito
Rind inventou uma maneira simples de visualizar o espaço de parâmetros do sistema Pearson (ou a distribuição de critérios), que posteriormente adotou. Hoje, muitos matemáticos e estatísticos usam esse método. Os tipos de distribuições de Pearson são caracterizados por duas quantidades, geralmente chamadas de β1 e β2. O primeiro é o quadrado da assimetria. A segunda é a curtose tradicional, ou o quarto momento padronizado: β2=γ2 + 3.
Os métodos matemáticos modernos definem a curtose γ2 como cumulantes em vez de momentos, então para umdistribuição temos γ2=0 e β2=3. Aqui vale a pena seguir o precedente histórico e usar β2. O diagrama à direita mostra qual é o tipo de uma distribuição Pearson específica (indicada pelo ponto (β1, β2).
Muitas das distribuições distorcidas e/ou não mesocúrticas que conhecemos hoje ainda não eram conhecidas no início da década de 1890. O que hoje é conhecido como distribuição beta foi usado por Thomas Bayes como o parâmetro posterior da distribuição de Bernoulli em seu artigo de 1763 sobre probabilidade inversa.
A distribuição beta ganhou destaque devido à sua presença no sistema Pearson e era conhecida até a década de 1940 como a distribuição Pearson tipo I. A distribuição do Tipo II é um caso especial do Tipo I, mas geralmente não é mais destacada.
A distribuição Gamma originou-se de seu próprio trabalho e era conhecida como Distribuição Normal Tipo III de Pearson antes de adquirir seu nome moderno nas décadas de 1930 e 1940. Um artigo de 1895 de um cientista apresentou a distribuição Tipo IV, que contém a distribuição t de Student, como um caso especial, anterior ao uso subsequente de William Seely Gosset em vários anos. Seu artigo de 1901 apresentou uma distribuição com gama inversa (tipo V) e primos beta (tipo VI).
Outra opinião
De acordo com Ord, Pearson desenvolveu a forma básica da equação (1) baseada na fórmula para a derivada do logaritmo da função densidade de distribuição normal (que dá uma divisão linear pela quadráticaestrutura). Muitos especialistas ainda estão engajados em testar a hipótese sobre a distribuição dos critérios de Pearson. E prova sua eficácia.
Quem foi Karl Pearson
Karl Pearson foi um matemático e bioestatístico inglês. Ele é creditado com a criação da disciplina de estatística matemática. Em 1911 ele fundou o primeiro departamento de estatística do mundo na University College London e fez contribuições significativas para as áreas de biometria e meteorologia. Pearson também foi um defensor do darwinismo social e da eugenia. Ele foi protegido e biógrafo de Sir Francis G alton.
Biometria
Karl Pearson foi fundamental na criação da escola de biometria, que era uma teoria concorrente para descrever a evolução e a herança das populações na virada do século XX. Sua série de dezoito artigos "Contribuições matemáticas para a teoria da evolução" o estabeleceu como o fundador da escola biométrica da herança. De fato, Pearson dedicou grande parte de seu tempo durante 1893-1904 a desenvolvimento de métodos estatísticos para biometria. Esses métodos, que são amplamente utilizados hoje para análise estatística, incluem o teste do qui-quadrado, desvio padrão, correlação e coeficientes de regressão.
A questão da hereditariedade
A lei da hereditariedade de Pearson afirmava que o germoplasma consiste em elementos herdados dos pais, bem como de ancestrais mais distantes, cuja proporção variava de acordo com várias características. Karl Pearson era um seguidor de G alton, e embora suatrabalhos diferiram em alguns aspectos, Pearson usou uma quantidade significativa de conceitos estatísticos de seu professor na formulação de uma escola biométrica para herança, como a lei da regressão.
Funções escolares
A escola biométrica, ao contrário dos mendelianos, não estava focada em fornecer um mecanismo de herança, mas em fornecer uma descrição matemática que não fosse de natureza causal. Enquanto G alton propôs uma teoria descontínua da evolução na qual as espécies mudariam em grandes s altos em vez de pequenas mudanças acumuladas ao longo do tempo, Pearson apontou falhas nesse argumento e realmente usou suas ideias para desenvolver uma teoria contínua da evolução. Os mendelianos preferiam a teoria descontínua da evolução.
Enquanto G alton se concentrou principalmente na aplicação de métodos estatísticos ao estudo da hereditariedade, Pearson e seu colega Weldon expandiram seu raciocínio nesta área, variação, correlações de seleção natural e sexual.
Um olhar sobre a evolução
Para Pearson, a teoria da evolução não pretendia identificar o mecanismo biológico que explica os padrões de herança, enquanto a abordagem mendeliana declarava o gene como o mecanismo de herança.
Pearson criticou Bateson e outros biólogos por não adotarem métodos biométricos em seu estudo da evolução. Ele condenou os cientistas que não se concentraram emvalidade estatística de suas teorias, afirmando:
"Antes de podermos aceitar [qualquer causa de mudança progressiva] como um fator, devemos não apenas mostrar sua plausibilidade, mas, se possível, demonstrar sua capacidade quantitativa."
Os biólogos sucumbiram a "especulações quase metafísicas sobre as causas da hereditariedade" que substituíram o processo de coleta de dados experimentais, o que pode realmente permitir que os cientistas reduzam as teorias potenciais.
Leis da natureza
Para Pearson, as leis da natureza eram úteis para fazer previsões precisas e resumir tendências em dados observados. O motivo foi a experiência “de que certa sequência aconteceu e se repetiu no passado.”
Assim, identificar um mecanismo específico da genética não tem sido um esforço digno para os biólogos, que deveriam se concentrar em descrições matemáticas dos dados empíricos. Isso em parte levou a uma disputa acirrada entre biometristas e mendelianos, incluindo Bateson.
Após este último rejeitar um dos manuscritos de Pearson que descrevia uma nova teoria da variação ou homotipia da descendência, Pearson e Weldon fundaram a empresa Biometrika em 1902. Embora a abordagem biométrica da herança tenha perdido sua perspectiva mendeliana, os métodos que eles desenvolveram na época são vitais para o estudo da biologia e evolução hoje.