Por que a média estatística e mediana de um histograma muitas vezes têm diferentes centros

Um histograma lhe dá uma ideia aproximada de onde o "centro" dos dados reside. A palavra centro está entre aspas porque muitas estatísticas diferentes são usados ​​para designar o centro. As duas medidas mais comuns de centro são a média (o significar) e o mediana.

Para visualizar a idade média (a média), imagine os dados como pessoas sentadas em vários lugares em uma gangorra (aka gangorra). Seu objetivo é equilibrá-lo. Como os dados não se movem ao redor, assumir as pessoas ficar onde estão e você mover o ponto de pivô (que você também pode pensar em como a dobradiça ou fulcro) onde quiser. A média é o lugar o ponto de pivô tem que estar em ordem para equilibrar o peso de cada lado da gangorra.

O ponto de equilíbrio da gangorra é afetado por quão longe as pessoas estão em cada lado, e não pelo número de pessoas de cada lado. Assim, a média é afectada pelos valores reais dos dados, em vez do que a quantidade de dados.

A mediana é o lugar onde você colocar o ponto de pivô para que você tenha um número igual de pessoas em cada lado da gangorra, independentemente de seus pesos. (Por conseguinte, a gangorra pode ainda estar fora de equilíbrio, em termos de pesos.) 'Assim, a mediana não é afectada pelos valores dos dados, apenas a sua localização dentro do conjunto de dados.

A média é afectada pela outliers Os valores no conjunto de dados que estão longe do resto dos dados, na parte alta e / ou a extremidade baixa. A mediana, sendo o número do meio, não é afectada por valores extremos.

menu