Estatísticas das Empresas For Dummies

Quando você está trabalhando com as populações e amostras (um subconjunto de uma população) nas estatísticas das empresas, você pode usar três tipos comuns de medidas para descrever o conjunto de dados: tendência central, dispersão, e associação.

Por convenção, as fórmulas estatísticas usadas para descrever medidas de população conter letras gregas, enquanto que as fórmulas usadas para descrever medidas amostra contêm letras latinas.

Medidas de tendência central

Em estatística, a média, mediana e moda são conhecidos como medidas de tendência central- eles são utilizados para identificar o centro de um conjunto de dados:

  • Significar: O valor entre os valores menores e maiores de um conjunto de dados, obtido por um método prescrito.

  • Mediana: O valor que divide um conjunto de dados em duas metades iguais

  • Modo: O valor mais comumente observada em um conjunto de dados

As amostras são escolhidos aleatoriamente a partir de populações. Se este processo for efectuado correctamente, cada amostra deve reflectir com precisão as características da população. Portanto, uma medida de amostra, tais como o significar, deve ser uma boa estimativa da medida da população correspondente. Considere os seguintes exemplos de média:

média da população:

Esta fórmula simplesmente diz-lhe para somar todos os elementos da população e dividir pelo tamanho da população.

Média da amostra:

image0.jpg

O processo para calcular este é exatamente o mesmo- você somar todos os elementos da amostra e dividir pelo tamanho da amostra.

Para além das medidas de tendência central, outros dois principais tipos de medidas são medidas de dispersão (spread) e medidas de associação.

Medidas de dispersão

Medidas de dispersão incluem variância / desvio padrão e percentis / quartis / intervalo interquartil. A variância e desvio padrão estão intimamente relacionados com cada outro o desvio padrão é sempre igual ao raiz quadrada da variância.

As fórmulas para a população e variância da amostra são:

variância da população:

image1.jpg

variância da amostra:

image2.jpg

percentis dividir-se um conjunto de dados em 100 partes iguais de cada um consistindo de 1 por cento dos valores no conjunto de dados. quartis são um tipo especial de percentiles- eles se separaram os dados em quatro partes iguais. o interquartile intervalo representa a média 50 por cento da data- ele é calculado como o terceiro quartil menos o primeiro quartil.

Medidas de associação

Um outro tipo de medida, conhecida como um medida de Associação, refere-se a relação entre duas amostras ou duas populações. Dois exemplos são o covariânciae a correlação:

covariância da população:

image3.jpg

covariância da amostra:

image4.jpg

correlação População:

image5.jpg

correlação de exemplo:

image6.jpg

A correlação está intimamente relacionado com o covariance- está definido para garantir que o seu valor é sempre entre um negativo e um positivo.

Variáveis ​​Aleatórias e Distribuições de Probabilidade nas estatísticas das empresas

variáveis ​​aleatórias e distribuições de probabilidade são dois dos conceitos mais importantes em estatísticas. UMA variável aleatória atribui valores numéricos únicos para os resultados de um experi- aleatório este é um processo que gera resultados incertos. UMA distribuição de probabilidade determina probabilidades para cada valor possível de uma variável aleatória.

Os dois tipos básicos de distribuições de probabilidade são discretas e contínuas. A distribuição de probabilidade discreta só pode assumir um finito número de valores diferentes.

Os exemplos de distribuições discretas incluem:

  • binômio

  • Geométrico

  • Poisson

Uma distribuição de probabilidade contínua pode assumir uma infinito número de valores diferentes. Os exemplos de distribuições contínuas incluem:

  • Uniforme

  • Normal

  • t de Student

  • Qui-quadrado

  • F

Entenda Distribuições de amostragem nas estatísticas das empresas

Nas estatísticas, as distribuições de amostragem são as distribuições de probabilidade de qualquer estatística dadas com base em uma amostra aleatória, e são importantes porque fornecem uma simplificação importante na rota para inferência estatística. Mais especificamente, eles permitem considerações analíticas a basear-se na distribuição de amostragem de uma estatística, em vez de sobre a distribuição de probabilidade conjunta de todos os valores das amostras individuais.

O valor de uma amostra estatística, tais como a média da amostra (X) é susceptível de ser diferente para cada amostra que é traçada a partir de uma população. Pode, portanto, ser considerado como um variável aleatória, cujas propriedades podem ser descritos com uma distribuição de probabilidade. A distribuição de probabilidade de uma amostra estatística é conhecido como um distribuição de amostras.

De acordo com um resultado fundamental nas estatísticas conhecido como o Teorema do Limite Central, a distribuição amostral da média da amostra é normal se uma das duas coisas é verdadeira:

  • A população subjacente é normal

  • O tamanho da amostra é de pelo menos 30

Dois momentos são necessários para calcular probabilidades para a amostra quer dizer- a média da distribuição de amostragem é igual a:

image0.png

O desvio-padrão da distribuição de amostragem (também conhecido como o erro padrão) Pode assumir um dos dois valores possíveis:

image1.png

Esta é a escolha apropriada para uma sample- "pequeno", por exemplo, o tamanho da amostra é inferior ou igual a 5 por cento do tamanho da população.

Se a amostra for "grande", o padrão de erro torna-se:

image2.png

As probabilidades pode ser calculado para a média da amostra directamente a partir da tabela padrão normal aplicando a seguinte fórmula:

image3.png

Explorar teste da hipótese nas estatísticas das empresas

Em estatística, htestes ypothesis refere-se ao processo de escolha entre hipóteses concorrentes sobre uma distribuição de probabilidade, com base nos dados observados a partir da distribuição. É um tema central e uma parte fundamental da linguagem das estatísticas.

teste de hipóteses é um procedimento de seis passos:

hipótese 1.Null

hipótese 2.Alternative

3.Level de significância

estatística 4.Test

valor 5.Critical (s)

6.Decision regra

o hipótese nula é uma declaração de que é suposto ser verdadeiro a menos que haja fortes evidências contraditórias. o hipótese alternativa é uma declaração de que serão aceitas no local da hipótese nula se for rejeitada.

o nível de significância é escolhido para controlar a probabilidade de um "tipo I" de erros este é o erro que resulta quando a hipótese nula é erroneamente rejeitada.

o estatística de teste e valores críticos são usados ​​para determinar se a hipótese nula deve ser rejeitada. o regra de decisão que é seguido é que um "extremos" resultados estatística de teste em rejeição da hipótese nula. Aqui, uma estatística de teste extremo é aquele que se encontra fora dos limites do valor crítico ou valores.

As hipóteses são frequentemente testados sobre os valores das medidas populacionais, como a média ea variância. Eles são também utilizados para determinar se uma população segue uma distribuição de probabilidade especificada. Eles também formam uma parte importante da análise de regressão, onde as hipóteses são usadas para validar os resultados de uma equação de regressão estimada.

Como as empresas Use Análise de Regressão Estatísticas

A análise de regressão é uma ferramenta estatística utilizada para a investigação das relações entre as variáveis. Normalmente, o investigador pretende saber o efeito causal de uma variável sobre a outra - o efeito de um aumento de preços sobre a demanda, por exemplo, ou o efeito de mudanças na oferta monetária sobre a taxa de inflação.

A análise de regressão é usada para estimar a intensidade e o sentido da relação entre duas variáveis ​​linearmente relacionadas: X e Y. X é a variável "independente" e Y é a variável "dependente".

Os dois tipos básicos de análise de regressão são os seguintes:

  • A análise de regressão simples: Usado para determinar a relação entre a variável dependente e uma única Variável independentes, por exemplo, a relação entre o rendimento das culturas e precipitação.

  • A análise de regressão múltipla: Utilizado para estimar a relação entre uma variável dependente e dois ou variables- mais independente, por exemplo, a relação entre os salários dos funcionários e sua experiência e educação.

    análise de regressão múltipla introduz várias complexidades adicionais, mas pode produzir resultados mais realistas do que a análise de regressão simples.

A análise de regressão é baseada em várias suposições fortes sobre as variáveis ​​que estão sendo estimados. Vários testes principais são usadas para garantir que os resultados são válidos, incluindo testes de hipóteses. Estes testes são utilizados para assegurar que os resultados de regressão não são simplesmente devido ao acaso, mas indicam uma relação real entre dois ou mais variáveis.

Uma equação de regressão estimada pode ser utilizado para uma ampla variedade de aplicações de negócios, tais como:

  • Medir o impacto sobre os lucros de uma corporação de um aumento nos lucros

  • Entender como sensíveis vendas da corporação estão a mudanças em gastos com publicidade

  • Vendo como um preço das ações é afetado por mudanças nas taxas de juros

A análise de regressão também pode ser usado para prever fins-por exemplo, uma equação de regressão pode ser usada para prever a demanda futura pelos produtos da empresa.

Devido à extrema complexidade da análise de regressão, é muitas vezes realizada através do uso de calculadoras especializadas ou programas de planilha.

menu