Funções de distribuição de uma variável aleatória. Como encontrar a função de distribuição de uma variável aleatória

Índice:

Funções de distribuição de uma variável aleatória. Como encontrar a função de distribuição de uma variável aleatória
Funções de distribuição de uma variável aleatória. Como encontrar a função de distribuição de uma variável aleatória
Anonim

Para encontrar as funções de distribuição de variáveis aleatórias e suas variáveis, é necessário estudar todas as características desta área de conhecimento. Existem vários métodos diferentes para encontrar os valores em questão, incluindo alterar uma variável e gerar um momento. Distribuição é um conceito baseado em elementos como dispersão, variações. No entanto, eles caracterizam apenas o grau de amplitude de espalhamento.

Funções de distribuição de uma variável aleatória
Funções de distribuição de uma variável aleatória

As funções mais importantes das variáveis aleatórias são aquelas relacionadas, independentes e igualmente distribuídas. Por exemplo, se X1 é o peso de um indivíduo selecionado aleatoriamente de uma população masculina, X2 é o peso de outro, …, e Xn é o peso de mais uma pessoa da população masculina, então precisamos saber como a função aleatória X é distribuído. Neste caso, aplica-se o teorema clássico chamado teorema do limite central. Ele permite que você mostre que para n grande a função segue distribuições padrão.

Funções de uma variável aleatória

O Teorema do Limite Central serve para aproximar valores discretos em consideração como binomial e Poisson. As funções de distribuição de variáveis aleatórias são consideradas, em primeiro lugar, em valores simples de uma variável. Por exemplo, se X é uma variável aleatória contínua com sua própria distribuição de probabilidade. Neste caso, exploramos como encontrar a função densidade de Y usando duas abordagens diferentes, a saber, o método da função de distribuição e a mudança na variável. Primeiro, apenas valores um para um são considerados. Então você precisa modificar a técnica de alterar a variável para encontrar sua probabilidade. Finalmente, precisamos aprender como a função de distribuição cumulativa inversa pode ajudar a modelar números aleatórios que seguem certos padrões sequenciais.

Método de distribuição dos valores considerados

O método da função de distribuição de probabilidade de uma variável aleatória é aplicável para encontrar sua densidade. Ao usar esse método, um valor cumulativo é calculado. Então, diferenciando-o, você pode obter a densidade de probabilidade. Agora que temos o método da função de distribuição, podemos ver mais alguns exemplos. Seja X uma variável aleatória contínua com uma certa densidade de probabilidade.

Qual é a função densidade de probabilidade de x2? Se você observar ou representar graficamente a função (superior e direita) y \u003d x2, poderá notar que é um X crescente e 0 <y<1. Agora você precisa usar o método considerado para encontrar Y. Primeiro, a função de distribuição cumulativa é encontrada, você só precisa diferenciar para obter a densidade de probabilidade. Fazendo isso, obtemos: 0<y<1. O método de distribuição foi implementado com sucesso para encontrar Y quando Y é uma função crescente de X. A propósito, f(y) integra-se em 1 sobre y.

No último exemplo, muito cuidado foi usado para indexar as funções cumulativas e densidade de probabilidade com X ou Y para indicar a qual variável aleatória elas pertenciam. Por exemplo, ao encontrar a função de distribuição cumulativa de Y, temos X. Se você precisa encontrar uma variável aleatória X e sua densidade, basta diferenciá-la.

Técnica de Mudança Variável

Seja X uma variável aleatória contínua dada por uma função de distribuição com denominador comum f (x). Nesse caso, se você colocar o valor de y em X=v (Y), obterá o valor de x, por exemplo, v (y). Agora, precisamos obter a função de distribuição de uma variável aleatória contínua Y. Onde a primeira e a segunda igualdade ocorrem a partir da definição de Y cumulativo. A terceira igualdade é válida porque a parte da função para a qual u (X) ≦ y é também é verdade que X ≦ v (Y). E o último é feito para determinar a probabilidade em uma variável aleatória contínua X. Agora precisamos tirar a derivada de FY (y), a função de distribuição cumulativa de Y, para obter a densidade de probabilidade Y.

Função de distribuição de uma variável aleatória contínua
Função de distribuição de uma variável aleatória contínua

Generalização para a função de diminuição

Seja X uma variável aleatória contínua com f (x) comum definida sobre c1<x<c2. E seja Y=u (X) uma função decrescente de X com inverso X=v (Y). Como a função é contínua e decrescente, existe uma função inversa X=v (Y).

Para resolver esse problema, você pode coletar dados quantitativos e usar a função de distribuição cumulativa empírica. Com essas informações e apelando para elas, você precisa combinar amostras de médias, desvios padrão, dados de mídia e assim por diante.

Da mesma forma, mesmo um modelo probabilístico bastante simples pode ter um grande número de resultados. Por exemplo, se você jogar uma moeda 332 vezes. Então o número de resultados obtidos de flips é maior que o do google (10100) - um número, mas não menos de 100 quintilhões de vezes maior que as partículas elementares no universo conhecido. Não está interessado em uma análise que dê uma resposta a todos os resultados possíveis. Seria necessário um conceito mais simples, como o número de caras ou o golpe mais longo das coroas. Para focar em questões de interesse, um resultado específico é aceito. A definição neste caso é a seguinte: uma variável aleatória é uma função real com um espaço de probabilidade.

O intervalo S de uma variável aleatória às vezes é chamado de espaço de estados. Assim, se X é o valor em questão, então N=X2, exp ↵X, X2 + 1, tan2 X, bXc e assim por diante. A última delas, arredondando X para o número inteiro mais próximo, é chamada de função floor.

Funções de distribuição

Uma vez que a função de distribuição de interesse para uma variável aleatória x é determinada, a pergunta geralmente se torna: "Quais são as chances de que X caia em algum subconjunto de valores B?". Por exemplo, B={números ímpares}, B={maior que 1} ou B={entre 2 e 7} para indicar os resultados que têm X, o valorvariável aleatória, no subconjunto A. Assim, no exemplo acima, você pode descrever os eventos da seguinte forma.

{X é um número ímpar}, {X é maior que 1}={X> 1}, {X é entre 2 e 7}={2 <X <7} para corresponder às três opções acima para o subconjunto B. Muitas propriedades de quantidades aleatórias não estão relacionadas a um determinado X. Em vez disso, elas dependem de como X aloca seus valores. Isso leva a uma definição que soa assim: a função de distribuição de uma variável aleatória x é cumulativa e é determinada por observações quantitativas.

Função de distribuição de uma variável aleatória discreta
Função de distribuição de uma variável aleatória discreta

Variáveis aleatórias e funções de distribuição

Assim, você pode calcular a probabilidade de que a função de distribuição de uma variável aleatória x tome valores no intervalo por subtração. Pense em incluir ou excluir endpoints.

Chamaremos uma variável aleatória discreta se ela tiver um espaço de estados finito ou infinito contável. Assim, X é o número de caras em três lançamentos independentes de uma moeda viciada que sobe com probabilidade p. Precisamos encontrar a função de distribuição cumulativa de uma variável aleatória discreta FX para X. Seja X o número de picos em uma coleção de três cartas. Então Y=X3 via FX. FX começa em 0, termina em 1 e não diminui à medida que os valores de x aumentam. A função de distribuição FX acumulada de uma variável aleatória discreta X é constante, exceto para s altos. Ao s altar o FX é contínuo. Prove a afirmação sobre o corretoa continuidade da função de distribuição da propriedade de probabilidade é possível usando a definição. Parece assim: uma variável aleatória constante tem um FX cumulativo que é diferenciável.

Para mostrar como isso pode acontecer, podemos dar um exemplo: um alvo com raio unitário. Presumivelmente. o dardo é distribuído uniformemente sobre a área especificada. Para alguns λ> 0. Assim, as funções de distribuição de variáveis aleatórias contínuas aumentam suavemente. FX tem as propriedades de uma função de distribuição.

Um homem espera no ponto de ônibus até que o ônibus chegue. Tendo decidido por si mesmo que ele recusará quando a espera atingir 20 minutos. Aqui é necessário encontrar a função de distribuição cumulativa para T. O tempo em que uma pessoa ainda estará na rodoviária ou não sairá. Apesar do fato de que a função de distribuição cumulativa é definida para cada variável aleatória. Mesmo assim, outras características serão usadas com bastante frequência: a massa para uma variável discreta e a função densidade de distribuição de uma variável aleatória. Normalmente, o valor é gerado por meio de um desses dois valores.

Encontre a função de distribuição de uma variável aleatória
Encontre a função de distribuição de uma variável aleatória

Funções de massa

Esses valores são considerados pelas seguintes propriedades, que possuem um caráter geral (de massa). A primeira baseia-se no fato de que as probabilidades não são negativas. A segunda decorre da observação de que o conjunto para todo x=2S, o espaço de estados para X, forma uma partição da liberdade probabilística de X. Exemplo: lançamento de uma moeda viciada cujos resultados são independentes. Você pode continuar fazendocertas ações até que você obtenha um rolo de cabeças. Seja X uma variável aleatória que fornece o número de coroas na frente da primeira cara. E p denota a probabilidade em qualquer ação.

Então, a função de probabilidade de massa tem as seguintes características. Como os termos formam uma sequência numérica, X é chamado de variável aleatória geométrica. Esquema geométrico c, cr, cr2,.,,, crn tem uma soma. E, portanto, sn tem um limite como n 1. Neste caso, a soma infinita é o limite.

A função massa acima forma uma sequência geométrica com uma razão. Portanto, os números naturais a e b. A diferença dos valores na função de distribuição é igual ao valor da função de massa.

Os valores de densidade considerados têm uma definição: X é uma variável aleatória cuja distribuição FX tem uma derivada. FX satisfazendo Z xFX (x)=fX (t) dt-1 é chamada de função de densidade de probabilidade. E X é chamado de variável aleatória contínua. No teorema fundamental do cálculo, a função densidade é a derivada da distribuição. Você pode calcular probabilidades calculando integrais definidas.

Como os dados são coletados de múltiplas observações, mais de uma variável aleatória de cada vez deve ser considerada para modelar os procedimentos experimentais. Portanto, o conjunto desses valores e sua distribuição conjunta para as duas variáveis X1 e X2 significa visualizar eventos. Para variáveis aleatórias discretas, são definidas funções de massa probabilísticas conjuntas. Para os contínuos, são considerados fX1, X2, ondea densidade de probabilidade conjunta é satisfeita.

Variáveis aleatórias independentes

Duas variáveis aleatórias X1 e X2 são independentes se quaisquer dois eventos associados a elas forem iguais. Em palavras, a probabilidade de que dois eventos {X1 2 B1} e {X2 2 B2} ocorram ao mesmo tempo, y, é igual ao produto das variáveis acima, de que cada um deles ocorra individualmente. Para variáveis aleatórias discretas independentes, existe uma função de massa probabilística conjunta, que é o produto do volume do íon limitante. Para variáveis aleatórias contínuas que são independentes, a função de densidade de probabilidade conjunta é o produto dos valores de densidade marginal. Finalmente, consideramos n observações independentes x1, x2,.,,, xn decorrentes de uma densidade desconhecida ou função de massa f. Por exemplo, um parâmetro desconhecido em funções para uma variável aleatória exponencial descrevendo o tempo de espera de um ônibus.

A variável aleatória é dada pela função de distribuição
A variável aleatória é dada pela função de distribuição

Imitação de variáveis aleatórias

O principal objetivo deste campo teórico é fornecer as ferramentas necessárias para desenvolver procedimentos de inferência baseados em princípios sólidos da ciência estatística. Assim, um caso de uso muito importante para software é a capacidade de gerar pseudo-dados para imitar informações reais. Isso possibilita testar e melhorar os métodos de análise antes de usá-los em bancos de dados reais. Isso é necessário para explorar as propriedades dos dados por meio demodelagem. Para muitas famílias de variáveis aleatórias comumente usadas, R fornece comandos para gerá-las. Para outras circunstâncias, serão necessários métodos para modelar uma sequência de variáveis aleatórias independentes que tenham uma distribuição comum.

Variáveis aleatórias discretas e padrão de comando. O comando sample é usado para criar amostras aleatórias simples e estratificadas. Como resultado, se uma sequência x for inserida, sample(x, 40) seleciona 40 registros de x de modo que todas as escolhas de tamanho 40 tenham a mesma probabilidade. Isso usa o comando R padrão para busca sem substituição. Também pode ser usado para modelar variáveis aleatórias discretas. Para fazer isso, você precisa fornecer um espaço de estados no vetor x e a função de massa f. Uma chamada para replace=TRUE indica que a amostragem ocorre com substituição. Então, para dar uma amostra de n variáveis aleatórias independentes que têm uma função de massa comum f, a amostra (x, n, replace=TRUE, prob=f) é usada.

Determinamos que 1 é o menor valor representado e 4 é o maior de todos. Se o comando prob=f for omitido, a amostra será amostrada uniformemente dos valores no vetor x. Você pode verificar a simulação em relação à função de massa que gerou os dados observando o sinal de igual duplo,==. E recalculando as observações que levam todos os valores possíveis para x. Você pode fazer uma mesa. Repita isso para 1000 e compare a simulação com a função de massa correspondente.

Ilustração da transformação de probabilidade

Primeirosimular funções de distribuição homogênea de variáveis aleatórias u1, u2,.,,, un no intervalo [0, 1]. Cerca de 10% dos números devem estar dentro de [0, 3, 0, 4]. Isso corresponde a 10% das simulações no intervalo [0, 28, 0, 38] para uma variável aleatória com a função de distribuição FX mostrada. Da mesma forma, cerca de 10% dos números aleatórios devem estar no intervalo [0, 7, 0, 8]. Isso corresponde a 10% de simulações no intervalo [0, 96, 1, 51] da variável aleatória com a função de distribuição FX. Esses valores no eixo x podem ser obtidos tomando o inverso de FX. Se X é uma variável aleatória contínua com densidade fX positiva em todo o seu domínio, então a função de distribuição é estritamente crescente. Neste caso, FX tem uma função inversa de FX-1 conhecida como função quantílica. FX (x) u somente quando x FX-1 (u). A transformação de probabilidade segue da análise da variável aleatória U=FX (X).

Função de distribuição de probabilidade de uma variável aleatória
Função de distribuição de probabilidade de uma variável aleatória

FX tem um intervalo de 0 a 1. Não pode estar abaixo de 0 ou acima de 1. Para valores de u entre 0 e 1. Se U puder ser simulado, então uma variável aleatória com distribuição FX precisa ser simulado por meio de uma função quantílica. Tome a derivada para ver que a densidade u varia dentro de 1. Como a variável aleatória U tem uma densidade constante no intervalo de seus valores possíveis, ela é chamada de uniforme no intervalo [0, 1]. Ele é modelado em R com o comando runif. A identidade é chamada de transformação probabilística. Você pode ver como funciona no exemplo de dardos. X entre 0 e 1, funçãodistribuição u=FX (x)=x2 e, portanto, a função quantil x=FX-1 (u). É possível modelar observações independentes da distância do centro do painel de dardos e, assim, criar variáveis aleatórias uniformes U1, U2,.,, Un. A função de distribuição e a função empírica são baseadas em 100 simulações da distribuição de um alvo de dardos. Para uma variável aleatória exponencial, presumivelmente u=FX (x)=1 - exp (- x) e, portanto, x=- 1 ln (1 - u). Às vezes, a lógica consiste em declarações equivalentes. Nesse caso, você precisa concatenar as duas partes do argumento. A identidade de interseção é semelhante para todos os 2 {S i i} S, em vez de algum valor. A união Ci é igual ao espaço de estados S e cada par é mutuamente exclusivo. Desde Bi - é dividido em três axiomas. Cada verificação é baseada na probabilidade P correspondente. Para qualquer subconjunto. Usar uma identidade para garantir que a resposta não dependa da inclusão dos pontos de extremidade de intervalo.

A lei da distribuição da função de uma variável aleatória
A lei da distribuição da função de uma variável aleatória

Função exponencial e suas variáveis

Para cada resultado em todos os eventos, a segunda propriedade da continuidade das probabilidades é usada em última análise, que é considerada axiomática. A lei de distribuição da função de uma variável aleatória aqui mostra que cada uma tem sua própria solução e resposta.

Recomendado: