Fórmulas estatísticos importantes para Big Data

A palavra estatística

pode evocar o medo em alguns iniciantes para visualização de dados, mas se você ignorar este tema, você vista para um dos mais poderosos meios para derivar verdadeiro insight e valor a partir de Big Data.

estatística é a prática ou a ciência da recolha de dados numéricos em grandes quantidades. Você não tem que sair e se tornar um cientista de dados (um termo usado para os estatísticos que também são nerds dados disfarçado e que normalmente detêm algum tipo de grau avançado, como um PhD), mas você pode querer considerar pegar a Estatísticas 101 livro ou classe, se você tem algum interesse.

fórmulas estatísticas, como a probabilidade, variância, e previsões são populares hoje. Eles são bastante fáceis de aplicar a qualquer conjunto de dados, e a maioria dos leitores vão entendê-las claramente. Você pode incorporar algumas dessas fórmulas estatísticas em suas visualizações de Big Data para fornecer valor real para os usuários usando as técnicas discutidas nas seções seguintes.

Sabendo que a probabilidade de que um evento ocorra

Uma fórmula estatística que você pode estar familiarizado com é probability - a probabilidade ou chance de que um evento pode occur.The seguinte fórmula calcula probabilidade básica para um cenário linear. (Cenários não-lineares são um pouco complexo e muito de uma empresa para um novato.)

Probabilidade = probabilidade de um evento ocorrer / Número de resultados possíveis

A figura a seguir mostra uma probabilidade com algumas cores de alerta adicionadas para tornar a mensagem de fácil leitura e, mais importante, para indicar claramente que é necessária uma ação imediata.

image0.jpg

Probabilidades fornecer uma verificação da realidade rápido e definir o tom geral para a história da visualização de dados estará fornecendo durante um determinado período (dia, semana, trimestre, e assim por diante).

Aplicando variância para mostrar a magnitude da mudança

Outra medida estatística popular é variance, que é a diferença entre um conjunto de pontos de dados.

A fórmula mais utilizada para o cálculo da variância é

Variância = desejado Final - Estado Atual

Se a saída exibida é um número inteiro ou percentagem, da fórmula mostra a magnitude da mudança entre o início e o estado final de um ponto de dados.

Exibindo a variância é sempre uma vitória rápida e um ótimo substituto para a linha / bar gráfico combinado, que é como a relação variância é exibido na maioria dos visualizações.

O gráfico na figura abaixo mostra uma linha / bar gráfico de combinação que permite que o usuário decifrar a variância para cada mês.

image1.jpg

O segundo gráfico, mostrado na figura a seguir, traça claramente a variância e leva todas as conjecturas fora do visual.

image2.jpg

Prever o futuro

No entanto, outra fórmula estatística popular que você pode estar familiarizado com o forecast, que é o ato de prever ou estimar um evento ou tendência.

Quando você calcula uma previsão, você está realmente usando uma certa quantidade de dados históricos para prever o comportamento, um evento específico, ou uma tendência. Por exemplo, você poderia calcular as vendas para o ano baseado no fato histórico que janeiro geralmente é responsável por 5% das vendas. Se você fez US $ 500 em vendas em janeiro, então você poderia usar a seguinte fórmula para prever o quanto as vendas que você pode antecipar para o ano:

$ 500 / .05 = $ 10.000

Nesta equação, US $ 500 é que as vendas em janeiro, 05 é o percentual histórico de vendas que janeiro contas para- e US $ 10.000 são as vendas projetadas para o ano.

A figura abaixo mostra como as previsões são exibidas na maioria das visualizações de dados como uma linha simples em um gráfico. As previsões indicam como uma determinada atividade pode realizar no futuro.

Este ecrã típico de uma linha de previsão mostra que o fluxo de caixa acabará por se tornar um problema para th
Este ecrã típico de uma linha de previsão mostra que o fluxo de caixa acabará por se tornar um problema para esta organização.

menu