O que fazer com Outliers em seus dados Metrics
A outlier
Menu
Existem dois tipos de dados em valores extremos:
Outliers causada por erros de medição ou de dados.
Outliers causada pelo primeiro indicador de mudanças de cauda longa em seus conjuntos de medição. (Longo-cauda é um termo de marketing referindo-se resultados apresentados ao longo do tempo.)
Outliers causados por erros
Para lidar com o primeiro tipo de outlier (um erro que você quer eliminar antes que corrompe seus dados), é preciso eliminá-lo. Eliminando o outlier requer várias etapas, a primeira das quais é exportar seus dados para uma planilha:
Classificar dados de sua planilha por ordem crescente.
Localize o número mediano.
O número mediano de 3 e 4, por exemplo, é de 3,5.
Encontrar o ponto em que 25 por cento das métricas em sua planilha são maiores.
Isso é chamado de quartil superior, ou Q2.
Encontrar o ponto em que 25 por cento das métricas em sua planilha são menores.
Isso é chamado de quartil inferior, ou Q1.
Subtrair Q1 do Q2.
O resultado é a intervalo interquartil. Você precisa deste intervalo para excluir os dados errados.
Multiplique o QI (intervalo interquartil) por 1,5.
Adicionar os resultados da etapa 6 para o quartil superior e, em seguida, subtrai-lo a partir do quartil inferior.
Esta etapa define parâmetros.
Marcar todos os dados fora deste conjunto de parâmetros como um outlier.
Multiplique o IQ por 3.
Tome os resultados do Passo 9 e adicioná-lo ao quartil superior e subtrai-lo a partir do quartil inferior.
O número resultante qualifica como um outlier extremo. valores atípicos extremos são os pontos de dados que você deve excluir de seus conjuntos de dados se você tiver dados errados.
Outliers causada pelo primeiro indicador de mudanças de cauda longa em seus conjuntos de medição
Se você está experimentando o segundo tipo de outlier (o primeiro indicador de uma mudança de cauda longa), então você precisa para segui-lo e criar mais métricas para descobrir o que ela significa para a sua marca e modelo de negócio.
Em vez de eliminar os dados, você deseja classificar-lo em seu próprio conjunto de dados de modo que você pode segui-lo ao longo do tempo. Essa classificação permite comparar os valores discrepantes de dados para o seu modelo de negócio e metas para ver se é um aumento da métrica.
Se você achar que a métrica é ganhando força, por assim dizer, então você sabe que é uma tendência futura emergentes e você pode transformar o seu foco futuro em direção a ela e fazer crescer o seu negócio em uma nova direção.