Como calcular dados proporções e encontrar o centro em R
Depois de ter a tabela de dados com as contagens, você pode usar R para calcular facilmente a proporção de cada contagem ao total simplesmente dividindo a mesa pelas contagens totais. Para calcular a proporção de caixas de velocidades manuais e automáticas no conjunto de dados carros, você pode usar o seguinte código:
> Amtable / sum (amtable) auto manual0.40625 0,59375
No entanto, R também fornece o prop.table () função para fazer o mesmo. Você pode obter o mesmo resultado exato como a linha de código anterior, fazendo o seguinte:
> Prop.table (amtable)
Você pode se perguntar por que você iria usar uma função extra para algo que é tão fácil como dividindo pela soma. o prop.table () função também pode calcular proporções marginais.
Em estatística, o modo de uma variável categórica é o valor que ocorre com maior frequência. Não é exatamente o centro de seus dados, mas se não há nenhuma ordem em seus dados - se você olhar para uma variável nominal - você não pode realmente falar sobre um centro de qualquer um.
Embora não haja uma função específica para calcular o modo, você pode obtê-lo através da combinação de alguns truques:
Para obter as contagens para cada valor, o uso mesa().
Para determinar a localização do número máximo de contagem, usar max ().
Para encontrar o modo de sua variável, selecione o nome correspondente com a localização na Etapa 2 da mesa na Etapa 1.
Assim, para encontrar o modo para a variável sou no conjunto de dados carros, você pode usar o seguinte código:
> id lt; - amtable == max (amtable)> nomes (amtable) [id] [1] "manual"
a variável identidade contém um vector lógico que tem o valor VERDADE para cada valor na tabela soutcapaz que é igual ao valor máximo no mesmo quadro. Você seleciona o nome dos valores em soutcapaz por este vetor lógica como um índice.
Você também pode usar o which.max () função para encontrar a localização do máximo num vector. Esta função tem uma desvantagem importante, porém: Se você tiver vários máximos, which.max () retornará à posição de apenas o primeiro máximo. Se você estiver interessado em todos os máximos, você deve usar a construção no exemplo anterior.