Fórmulas estatísticos importantes para Big Data
A palavra estatística
Menu
estatística é a prática ou a ciência da recolha de dados numéricos em grandes quantidades. Você não tem que sair e se tornar um cientista de dados (um termo usado para os estatísticos que também são nerds dados disfarçado e que normalmente detêm algum tipo de grau avançado, como um PhD), mas você pode querer considerar pegar a Estatísticas 101 livro ou classe, se você tem algum interesse.
fórmulas estatísticas, como a probabilidade, variância, e previsões são populares hoje. Eles são bastante fáceis de aplicar a qualquer conjunto de dados, e a maioria dos leitores vão entendê-las claramente. Você pode incorporar algumas dessas fórmulas estatísticas em suas visualizações de Big Data para fornecer valor real para os usuários usando as técnicas discutidas nas seções seguintes.
Sabendo que a probabilidade de que um evento ocorra
Uma fórmula estatística que você pode estar familiarizado com é probability - a probabilidade ou chance de que um evento pode occur.The seguinte fórmula calcula probabilidade básica para um cenário linear. (Cenários não-lineares são um pouco complexo e muito de uma empresa para um novato.)
Probabilidade = probabilidade de um evento ocorrer / Número de resultados possíveis
A figura a seguir mostra uma probabilidade com algumas cores de alerta adicionadas para tornar a mensagem de fácil leitura e, mais importante, para indicar claramente que é necessária uma ação imediata.
Probabilidades fornecer uma verificação da realidade rápido e definir o tom geral para a história da visualização de dados estará fornecendo durante um determinado período (dia, semana, trimestre, e assim por diante).
Aplicando variância para mostrar a magnitude da mudança
Outra medida estatística popular é variance, que é a diferença entre um conjunto de pontos de dados.
A fórmula mais utilizada para o cálculo da variância é
Variância = desejado Final - Estado Atual
Se a saída exibida é um número inteiro ou percentagem, da fórmula mostra a magnitude da mudança entre o início e o estado final de um ponto de dados.
Exibindo a variância é sempre uma vitória rápida e um ótimo substituto para a linha / bar gráfico combinado, que é como a relação variância é exibido na maioria dos visualizações.
O gráfico na figura abaixo mostra uma linha / bar gráfico de combinação que permite que o usuário decifrar a variância para cada mês.
O segundo gráfico, mostrado na figura a seguir, traça claramente a variância e leva todas as conjecturas fora do visual.
Prever o futuro
No entanto, outra fórmula estatística popular que você pode estar familiarizado com o forecast, que é o ato de prever ou estimar um evento ou tendência.
Quando você calcula uma previsão, você está realmente usando uma certa quantidade de dados históricos para prever o comportamento, um evento específico, ou uma tendência. Por exemplo, você poderia calcular as vendas para o ano baseado no fato histórico que janeiro geralmente é responsável por 5% das vendas. Se você fez US $ 500 em vendas em janeiro, então você poderia usar a seguinte fórmula para prever o quanto as vendas que você pode antecipar para o ano:
$ 500 / .05 = $ 10.000
Nesta equação, US $ 500 é que as vendas em janeiro, 05 é o percentual histórico de vendas que janeiro contas para- e US $ 10.000 são as vendas projetadas para o ano.
A figura abaixo mostra como as previsões são exibidas na maioria das visualizações de dados como uma linha simples em um gráfico. As previsões indicam como uma determinada atividade pode realizar no futuro.