Como usar Terrenos quantil para verificar os dados de normalidade em R

Histogramas deixam muito à interpretação do espectador. A melhor maneira gráfica em R dizer se seus dados são distribuídos normalmente é olhar para um gráfico chamado quantil-quantil (QQ).

Com esta técnica, é traçar quantis uns contra os outros. Se você comparar duas amostras, por exemplo, basta comparar os quantis de ambas as amostras. Ou, para colocá-lo um pouco diferente, R faz o seguinte para construir uma trama QQ:

  • É ordena os dados de ambas as amostras.

  • Ele representa graficamente estes valores ordenados uns contra os outros.

Se ambas as amostras não contêm o mesmo número de valores, valores adicionais de R calcula-se por interpolação para a menor amostra para criar duas amostras do mesmo tamanho.

Como comparar duas amostras de dados

Claro, você não tem que fazer isso tudo por si mesmo, você pode simplesmente usar o qqplot () função para que. Assim, para verificar se as temperaturas durante a atividade e durante o repouso são distribuídos igualmente, basta fazer o seguinte:

> Qqplot (beaver2 $ temp [beaver2 $ activ == 1], + beaver2 $ temp [beaver2 $ activ == 0])

Isto cria uma trama onde os valores ordenados, são representados graficamente contra o outro.

image0.png

Entre os colchetes, você pode usar um vetor lógico para selecionar os casos que você deseja. Aqui você seleciona todos os casos em que a variável activ é igual a 1 para a primeira amostra, e todos os casos em que é igual a variável 0 para a segunda amostra.

Como usar uma trama R QQ para verificar a normalidade dos dados

Na maioria dos casos, não querer comparar duas amostras umas com as outras, mas comparar uma amostra com uma amostra teórica que vem a partir de uma certa distribuição (por exemplo, a distribuição normal).

Para fazer uma trama QQ desta forma, R tem o especial qqnorm () função. Como o nome indica, esta função traça sua amostra de encontro a uma distribuição normal. Você simplesmente dar a amostra que pretende representar graficamente como um primeiro argumento e adicionar quaisquer parâmetros gráficos que você gosta.

R cria então uma amostra com valores provenientes do padrão distribuição normal, ou uma distribuição normal com uma média de zero e um desvio padrão de um. Com esta segunda amostra, R cria a trama QQ como explicado antes.

R também tem um qqline () função, o que acrescenta uma linha ao seu plot normal QQ. Esta linha faz com que seja muito mais fácil de avaliar se você vê um claro desvio da normalidade. Quanto mais perto todos os pontos de mentir para a linha, mais próximo a distribuição de sua amostra trata da distribuição normal. o qqline () função também leva a amostra como um argumento.

Agora você quer fazer isso para as temperaturas durante tanto o ativo e o período inactivo do castor. Você pode usar o qqnorm () funcionar duas vezes para criar as duas parcelas. Para os períodos inativos, você pode usar o seguinte código:

> Qqnorm (beaver2 $ temp [beaver2 $ activ == 0], principais = 'inativo')> qqline (beaver2 $ temp [beaver2 $ activ == 0])

Você pode fazer o mesmo para o período ativo, alterando o valor 0 para 1.

image1.png

menu