Análise quantitativa dos dados exploratória (EDA) Techniques

Embora EDA é baseado principalmente em técnicas gráficas, ele também consiste de algumas técnicas quantitativas. Este artigo discute duas delas: a estimativa do intervalo e testes de hipóteses.

estimativa de intervalo

estimativa de intervalo é uma técnica que é usada para construir um alcance de valores dentro do qual uma variável é provável cair. Um exemplo importante disto é o intervalo de confiança. UMA Intervalo de confiança é uma série de números que é susceptível de conter o valor de uma medida de população, tais como a média. Um intervalo de confiança é construído como se segue:

image0.jpg

O intervalo de confiança é composto por um limite inferior igual à estimativa pontual menos a margem de erro, e um limite superior igual à estimativa pontual mais a margem de erro.

o estimativa pontual é um único valor estimado a partir de uma amostra. Por exemplo, a média da amostra é uma estimativa pontual da média da população. Do mesmo modo, o desvio padrão da amostra é uma estimativa do ponto de o desvio padrão da população.

A margem de erro reflete a quantidade de incerteza associada à estimativa pontual. Em outras palavras, mostra quanto a estimativa pontual pode mudar de uma amostra para a próxima. A margem de erro é baseado no desvio padrão e o tamanho da amostra a ser utilizado. O resultado destes cálculos é uma gama de valores que é susceptível de conter o verdadeiro valor da medida de população.

Por exemplo, suponha que um pesquisador determina que, com 95 por cento de confiança, o intervalo (-2,0 por cento, 8,0 por cento) contém o verdadeiro valor do retorno médio para o SP 500 no próximo ano. A média da amostra é a média do limite superior e inferior desse intervalo (isto é, 3,0 por cento). A margem de erro é portanto de 5 por cento.

Testando hipóteses

UMA hipótese estatística é uma declaração de que é suposto ser verdadeiro a menos que haja fortes evidências contraditórias. teste de hipóteses é amplamente utilizado em muitas disciplinas para determinar se uma proposição é verdadeira ou falsa. Por exemplo, testes de hipóteses poderia ser utilizado para determinar se

  • A idade média dos residentes de um estado é de 43 anos de idade.

  • O retorno médio para os estoques em uma carteira é de 7,2 por cento.

  • A quantidade de precipitação anual em uma cidade segue a distribuição normal.

testes de hipóteses é um processo multi-passo que consiste no seguinte:

  1. A declaração da hipótese nula: Esta é a afirmação de que é assumido para ser verdade.

  2. A declaração da hipótese alternativa: Esta é a afirmação de que será aceite se a hipótese nula é rejeitada.

  3. O nível de significância para o qual o teste de hipótese será realizado: Este é igual a probabilidade de rejeitar a hipótese nula quando ela é falsa.

  4. A estatística de teste: Esta é uma medida numérica que mostra se os dados da amostra é consistente com a hipótese nula.

  5. O valor crítico: Se a estatística de teste é mais extremo do que o valor crítico, a hipótese nula é rejeitada.

  6. A decisão: Com base na relação entre a estatística de teste e o valor crítico, de tomar uma decisão quanto à possibilidade ou não a hipótese nula deve ser rejeitada.

menu