Como calcular a variância: explicação com exemplos

Índice:

Como calcular a variância: explicação com exemplos
Como calcular a variância: explicação com exemplos
Anonim

A teoria da probabilidade trabalha com variáveis aleatórias. Para variáveis aleatórias, existem as chamadas leis de distribuição. Tal lei descreve sua variável aleatória com perfeição absoluta. No entanto, ao trabalhar com conjuntos reais de variáveis aleatórias, muitas vezes é muito difícil estabelecer imediatamente a lei de sua distribuição e se limitam a um determinado conjunto de características numéricas. Por exemplo, calcular a média e a variância de uma variável aleatória geralmente é muito útil.

Por que é necessário

Se a essência da esperança matemática estiver próxima do valor médio da quantidade, então neste caso a dispersão diz como os valores da nossa quantidade estão espalhados em torno dessa expectativa matemática. Por exemplo, se medimos o QI de um grupo de pessoas e queremos examinar os resultados da medição (amostra), a expectativa matemática mostrará o valor médio aproximado do quociente de inteligência para esse grupo de pessoas, e se calcularmos a variância da amostra, descobriremos como os resultados são agrupados em torno da expectativa matemática: um monte próximo a ela (pequena variação no QI) ou mais uniformemente em toda a faixa do resultado mínimo ao máximo (grande variação e em algum lugar no meio - expectativa matemática).

Para calcular a variância, você precisa de uma nova característica de uma variável aleatória - o desvio do valor do cálculo matemáticoesperando.

Desvio

Para entender como calcular a variância, você deve primeiro entender o desvio. Sua definição é a diferença entre o valor que uma variável aleatória assume e sua expectativa matemática. Grosso modo, para entender como um valor é “disperso”, você precisa observar como seu desvio é distribuído. Ou seja, substituímos o valor do valor pelo valor de seu desvio do tapete. expectativas e explorar sua lei de distribuição.

A lei de distribuição de uma variável discreta, ou seja, uma variável aleatória que assume valores individuais, é escrita na forma de uma tabela, onde o valor do valor é correlacionado com a probabilidade de sua ocorrência. Então, na lei de distribuição de desvios, a variável aleatória será substituída por sua fórmula, na qual existe um valor (que manteve sua probabilidade) e seu próprio tapete. esperando.

Propriedades da lei de distribuição do desvio de uma variável aleatória

Escrevemos a lei de distribuição para o desvio de uma variável aleatória. Dele, podemos extrair até agora apenas uma característica como a expectativa matemática. Por conveniência, é melhor usar um exemplo numérico.

Haja uma lei de distribuição de alguma variável aleatória: X - valor, p - probabilidade.

lei de distribuição
lei de distribuição

Calculamos a expectativa matemática usando a fórmula e imediatamente o desvio.

Valor esperado
Valor esperado

Desenhando uma nova tabela de distribuição de desvios.

Lei de distribuição para desvio
Lei de distribuição para desvio

Nós calculamos a expectativa aqui também.

Expectativa matemática para desvio
Expectativa matemática para desvio

Acontece zero. Há apenas um exemplo, mas sempre será assim: não é difícil provar isso no caso geral. A fórmula para a expectativa matemática do desvio pode ser decomposta na diferença entre as expectativas matemáticas de uma variável aleatória e, por mais torta que possa parecer, a expectativa matemática do tapete. expectativas (recursão, no entanto), que são as mesmas, portanto, sua diferença será zero.

Isso é esperado: afinal, os desvios de sinal podem ser tanto positivos quanto negativos, portanto, em média, devem dar zero.

Como calcular a variância de um caso discreto. quantidades

Se mat. é inútil calcular a expectativa de desvio, você tem que procurar outra coisa. Você pode simplesmente pegar os valores absolutos dos desvios (módulo); mas com módulos, tudo não é tão simples, então os desvios são elevados ao quadrado, e então sua expectativa matemática é calculada. Na verdade, é isso que eles querem dizer quando falam sobre como calcular a variância.

Ou seja, pegamos os desvios, elevamos ao quadrado e fazemos uma tabela de desvios quadrados e probabilidades que correspondem a variáveis aleatórias. Esta é uma nova lei de distribuição. Para calcular a expectativa matemática, você precisa adicionar os produtos do quadrado do desvio e a probabilidade.

Fórmula mais fácil

No entanto, o artigo começou com o fato de que a lei de distribuição da variável aleatória inicial é muitas vezes desconhecida. Então, algo mais leve é necessário. De fato, existe outra fórmula que permite calcular a variância da amostra usando apenas o tapete.esperando:

Dispersão - a diferença entre o tapete. expectativa do quadrado de uma variável aleatória e, inversamente, o quadrado de sua esteira. esperando.

Existe uma prova para isso, mas não faz sentido apresentá-la aqui, pois não tem valor prático (e só precisamos calcular a variância).

Como calcular a variância de uma variável aleatória em séries variacionais

Na estatística real, é impossível refletir todas as variáveis aleatórias (porque, grosso modo, há, via de regra, um número infinito delas). Portanto, o que entra no estudo é a chamada amostra representativa de alguma população geral geral. E, como as características numéricas de qualquer variável aleatória dessa população geral são calculadas a partir da amostra, elas são chamadas de amostra: média amostral, respectivamente, variância amostral. Você pode calculá-lo da mesma forma que o usual (através dos desvios ao quadrado).

Variação tendenciosa da amostra
Variação tendenciosa da amostra

No entanto, tal dispersão é chamada de tendenciosa. A fórmula de variância imparcial parece um pouco diferente. Geralmente é necessário calculá-lo.

Amostra de variação imparcial
Amostra de variação imparcial

Pequena adição

Mais uma característica numérica está ligada à dispersão. Também serve para avaliar como a variável aleatória se espalha ao redor de sua esteira. expectativas. Não há muita diferença em como calcular a variância e o desvio padrão: o último é a raiz quadrada do primeiro.

Recomendado: