Top 10 Fórmulas Estatísticas

Fórmulas - você simplesmente não pode ficar longe deles quando você está estudando estatísticas. Aqui estão dez fórmulas estatísticas que você usa com frequência e os passos para o seu cálculo.

Proporção

Algumas variáveis ​​são categóricas e identificar qual categoria ou grupo um indivíduo pertence. Por exemplo, # 147-relação estatuto # 148- é uma variável categórica, e um indivíduo pode ser único, datar, casado, divorciado, e assim por diante.

O número real de indivíduos numa determinada categoria é chamado o freqüência para essa categoria. UMA proporção, ou frequência relativa, representa a percentagem de indivíduos que cai em cada categoria. A proporção de uma dada categoria, denotada por p, é a frequência dividida pelo tamanho total da amostra.

Assim, para calcular a proporção, você

  1. Contar todos os indivíduos da amostra que se enquadram na categoria especificada.

  2. Dividido por n, o número de indivíduos da amostra.

Significar

o significar, ou o média de um conjunto de dados, é uma maneira de medir o centro de um conjunto de dados numéricos. A notação para a média é

image0.png

A fórmula para a média é

image1.png

Onde x representa cada um dos valores no conjunto de dados.

Para calcular a média, você

  1. Some todos os números no conjunto de dados.

  2. Dividido por n, o número de valores no conjunto de dados.

Mediana

o mediana de um conjunto de dados numérica é outra maneira de medir o centro. A mediana é o valor médio depois de ordenar os dados do menor ao maior.

Para calcular a mediana, passar pelas seguintes etapas:

  1. Ordenar os números do menor ao maior.

  2. Para uma quantidade ímpar de números, escolher aquele que cai exatamente no meio. Você já identificou a mediana.

  3. Para uma quantidade ainda de números, pegue os dois números exatamente no meio e média-los para encontrar a mediana.

Desvio padrão da amostra

o desvio padrão de uma amostra é uma medida da quantidade de variabilidade na amostra. Você pode pensar nisso, em termos gerais, como a distância média da média. A fórmula para o desvio padrão é

image2.png

Para calcular o desvio padrão,

  1. Localizar a média de todos os números,

    image3.png
  2. Tome cada número e subtrair a média a partir dele.

  3. Quadrados cada um dos valores resultantes.

  4. Adicioná-los todos para cima.

  5. Dividido por n - 1.

  6. Tirar a raiz quadrada.

percentil

percentis é uma maneira de determinar um valor relativo individual para todos os outros valores de um conjunto de dados. Quando tomar um teste padronizado, você recebe uma pontuação bruta individual e um percentil. Se você entrar em no percentil 90, por exemplo, 90 por cento dos resultados dos testes de todos os estudantes são os mesmos ou abaixo de seu (e 10 por cento estão acima seu). De um modo geral, estar no kmeios percentil k por cento da mentira dados em ou abaixo desse ponto e (100 - k) Por cento mentira acima dela.

Para calcular um percentual, você

  1. Converter o valor original para um escore padrão, utilizando o z-Fórmula,

    image4.png

    Onde x é o valor original,

    image5.png

    é a média da população de todos os valores e

    image6.png

    é o desvio padrão da população de todos os valores.

  2. Use o Z-tabela para encontrar o percentil correspondente para a pontuação padrão.

Margem de erro para a média da amostra

o margem de erro para o seu mea amostran,

image7.png

é a quantidade que você espera a média da amostra a variar de amostra para amostra. A fórmula para a margem de erro para

image8.png

lidar com as amostras de tamanho 30 ou mais, é

image9.png

Onde z* É o valor normal padrão para o nível de confiança que você deseja.

Para calcular a margem de erro para

image10.png

você

  1. Determinar o nível de confiança e encontrar a apropriada z*.

  2. Encontre o desvio padrão

    image11.png

    eo tamanho da amostra, n.

  3. Multiplicar z* de

    image12.png

    dividida pela raiz quadrada de n.

O tamanho da amostra necessária

Se você quiser calcular um intervalo de confiança para a média da população com uma certa margem de erro, você pode descobrir o tamanho da amostra que você precisa antes de recolher quaisquer dados. A fórmula para o tamanho da amostra para

image13.png

é

image14.png

Onde z* É o valor normal padrão para o nível de confiança, MOE é a sua margem desejado de erro e

image15.png

é o desvio padrão. Porque

image16.png

é um valor desconhecido que você precisa, você pode ter que fazer um estudo piloto (pequeno estudo experimental) para chegar a uma estimativa para o valor do desvio padrão.

Para calcular o tamanho da amostra para

image17.png

executado através dos seguintes passos:

  1. Multiplicar z* vezes s.

  2. Divida pela margem desejada de erro, MOE.

  3. Quadrado-lo.

  4. Volta qualquer quantidade fracionada para o número inteiro mais próximo (para que você atingir o seu MOE desejado ou melhor).

estatística de teste para a média

Ao realizar um teste de hipótese para a média da população, você toma a média da amostra e descobrir o quão longe é a partir do valor reivindicado em termos de uma pontuação padrão. O escore padrão é chamado de statisti testec. A fórmula para a estatística de teste para a média é

image18.png

Onde

image19.png

é o valor para o reivindicado média da população (O valor que se senta na hipótese nula).

Para calcular a estatística de teste para a média da amostra para amostras de tamanho 30 ou mais, você

  1. Calcule a média da amostra,

    image20.png

    eo desvio padrão da amostra, s.

  2. Levar

    image21.png
  3. Calcular o erro padrão,

    image22.png
  4. Divida o resultado da etapa 2 pelo erro padrão encontrado na Etapa 3.

Correlação

Amostra correlação é uma medida da força e direcção da relação linear entre duas variáveis ​​quantitativas x e Y. Não mede qualquer outro tipo de relacionamento, e ela não se aplica a variáveis ​​categóricas. A fórmula para correlação é

image23.png

Para calcular a correlação, você

  1. Localizar a média de todos os x valores e chamá-lo

    image24.png

    Localizar a média de todos os y valores e chamá-lo

    image25.png
  2. Encontrar o desvio padrão de todos os x valores e chamá-lo sx. Encontrar o desvio padrão de todos os y valores e chamá-lo sy.

  3. Para cada (x, y) Par no conjunto de dados, tomar x menos

    image26.png

    e y menos

    image27.png

    e multiplicá-los juntos.

  4. Adicionar todos estes produtos em conjunto para obter uma soma.

  5. Divida a soma por sx x sy.

  6. Divida o resultado por N - 1, onde n é o número de (x, ypares). (Esta é a mesma como a multiplicação por um longo N - 1.)

Linha de regressão

Depois de examinar um conjunto disperso entre duas variáveis ​​numéricas e calcular a correlação da amostra entre as duas variáveis, você pode observar uma relação linear entre eles. Nesse caso, seria apropriado para estimar um linha de regressão para estimar o valor da variável de resposta (Y) Dado um valor para a variável explicativa (x).

Antes de calcular a linha de regressão, você precisa de cinco estatísticas resumidas:

  • A média do x valores

    image28.png
  • A média do y valores

    image29.png
  • O desvio padrão do x valores (denotado sx)

  • O desvio padrão do y valores (denotado sy)

  • A correlação entre x e Y (denotado r)

Assim, para calcular a linha de regressão de melhor ajuste, você

  1. Encontre a inclinação usando a fórmula

    image30.png
  2. Encontre o y-intercepção utilizando a fórmula

    image31.png
  3. Reunir os resultados dos passos 1 e 2 para dar-lhe a linha de regressão: y = mx + b.

menu