Quando usar o F-Distribuição

O F-distribuição é um contínuo distribuição de probabilidade, o que significa que é definida por um infinito número de valores diferentes. O F-distribuição pode ser usado para vários tipos de aplicações, incluindo testar hipóteses sobre a igualdade de dois desvios população e testar a validade de uma equação de regressão múltipla.

As ações F-distribuição Uma propriedade importante, com distribuição t de Student: As probabilidades são determinadas por um conceito conhecido como graus de liberdade. Ao contrário de distribuição t de Student, o F-distribuição é caracterizada por dois diferentes tipos de graus de liberdade - numerador e denominador graus de liberdade.

O F-distribuição tem duas propriedades importantes:

  • É definido apenas para valores positivos.

  • Está não simétrica sobre o seu significado em vez disso, ele é inclinado positivamente.

Uma distribuição é positivamente enviesada se a média é maior do que a mediana. (A média é o valor da média de uma distribuição, e a mediana é a metade midpoint- dos valores na distribuição que estão abaixo da média, e a outra metade são acima).

Um bom exemplo de uma distribuição positivamente inclinada é a renda familiar. Suponha-se que metade das famílias em um país têm renda inferior a US $ 50.000 e metade tem renda acima de US $ 50.000- isso indica que a renda familiar média é de R $ 50.000. Entre as famílias com renda inferior a US $ 50.000, o menor valor possível é de R $ 0. Entre as famílias com renda acima de US $ 50.000, pode haver rendimentos de vários milhões de dólares por ano. Este desequilíbrio entre renda abaixo da média e acima da mediana faz com que a média a ser substancialmente superior à mediana. Suponha, por exemplo, que a renda média, neste caso, é de R $ 120.000. Isso mostra que a distribuição dos rendimentos do agregado familiar é distorcida de forma positiva.

A forma do F-distribuição varia de acordo com os seus graus de liberdade (DF).
A forma do F-distribuição varia de acordo com os seus graus de liberdade (DF).

Esta figura mostra um gráfico da distribuição F para diferentes combinações de numerador e o denominador graus de liberdade. Em cada caso, graus de liberdade do numerador são listados em primeiro lugar, e os graus de liberdade do denominador são listados segundo. O nível de significância em cada caso é de 0,05.

Um nível de significância é utilizado para testar um hipótese. Um teste de hipótese começa com uma hipótese nula- esta é uma afirmação que é suposto ser verdadeiro a menos que haja forte evidência contrária. Há também uma está alternativa hypothesis- esta é uma afirmação que é aceite em vez da hipótese nula se há evidência suficiente para rejeitar a hipótese nula.

O nível de significância, designado

image1.png

refere-se à probabilidade de rejeitar incorretamente a hipótese nula quando ela é realmente verdade. Isto é conhecido como um erro de tipo I. Em contraste, uma erro de tipo II ocorre quando você deixar de rejeitar a hipótese nula quando é realmente falsa. Portanto, com um nível de significância de 0,05, há uma chance de 5 por cento de cometer um erro do Tipo I.

A figura mostra que a distribuição não está definido para valores negativos (como você pode ver, não há valores negativos aparecem ao longo do eixo horizontal). Além disso, como o número de graus de liberdade aumenta, a forma da distribuição se desloca para a direita. A distribuição tem uma longa cauda direita (mais formalmente, é desviada para a direita, ou inclinado positivamente).

menu