Como gráficos podem distorcer Estatísticas
Um gráfico estatístico pode dar-lhe uma falsa imagem das estatísticas em que se baseia. Por exemplo, ele pode ser enganadora através da escolha de escala no eixo de frequência / frequência relativas (isto é, o eixo em que as quantidades de cada grupo são apresentados), e / ou o seu valor de partida.
Usando uma escala "esticado" (por exemplo, tendo cada meia polegada de um bar representam 10 unidades contra 50 unidades), você pode esticar a verdade, fazer diferenças olhar mais dramático, ou exagerar valores. Verdade de alongamento também pode ocorrer se o eixo de frequência começa em um número que é muito perto de onde as diferenças nas alturas das barras iniciar- que está na essência cortar fora a parte inferior das barras (a parte menos interessante) e apenas mostrando seus topos, enfatizando (de forma enganosa) onde está a ação. Não cada eixo de frequência tem que começar do zero, mas cuidado para situações que elevam as diferenças.
Aqui está um bom exemplo de um gráfico com uma escala estendido;
A Loteria Kansas mostra rotineiramente seus resultados recentes da Pick 3 Lottery. Uma das estatísticas relatados é o número de vezes que cada número (de 0 a 9) é desenhada entre os três números vencedores. A tabela mostra um gráfico do número de vezes que cada número foi elaborado durante a 1.613 total de Escolha 3 jogos (4.839 números únicos desenhada). Ele também relata a porcentagem de vezes que cada número foi elaborado. Dependendo de como você optar por olhar para estes resultados, você pode fazer as estatísticas parecem contar histórias muito diferentes.
Números sorteados na loteria Pick 3 | ||
número Drawn | No. da Times Drawn fora de 4839 | Porcentagem de vezes Desenhada (No. da Times Drawn dividir-4839) |
---|---|---|
0 | 485 | 10,0% |
1 | 468 | 9,7% |
2 | 513 | 10,6% |
3 | 491 | 10,1% |
4 | 484 | 10,0% |
5 | 480 | 9,9% |
6 | 487 | 10,1% |
7 | 482 | 10,0% |
8 | 475 | 9,8% |
9 | 474 | 9,8% |
A maneira como as loterias tipicamente exibir resultados como os da tabela é mostrada no gráfico superior na imagem a seguir.
Observe que, neste quadro, parece que o número 1 não se mete quase tão frequentemente (apenas 468 vezes) como o número 2 faz (513 vezes). A diferença na altura destas duas barras parece ser muito grande, exagerar a diferença no número de vezes que esses dois números sorteados. No entanto, para colocar isto em perspectiva, a diferença real aqui é 513-468 = 45 de um total de 4.839 números sorteados. Em termos de percentagens, a diferença entre o número de vezes que o número 1 e o número 2 são desenhadas é 45 # 247- 4839 = 0,009, ou apenas nove décimos de um por cento (0,009 x 100% = 0,9%).
Por que o gráfico superior na imagem feita dessa maneira? Ele pode levar as pessoas a pensar que eles têm uma borda interna se escolher o número 2 porque é "em uma raia quente" - ou eles podem ser levados a escolher o número 1 porque é "devido a vir para cima." Ambas estas teorias estão erradas, por caminho- porque os números são escolhidos aleatoriamente, o que aconteceu no passado não importa. O gráfico inferior na figura tem sido feito corretamente.