As medidas de tendência central mostram os valores centrais ou médios do conjunto de dados
Uma medida de tendência central é um valor único que tenta descrever um conjunto de dados identificando a posição central dentro desse conjunto de dados.
Média
Média da amostra
A média aritmética da amostra, ou simplesmente a média, é a média aritmética de todos os itens em um conjunto de dados.
É representada matematicamente da seguinte forma:
A média aritmética como medida de tendência central é simples e fácil de usar. Porém, ela tem desvantagens e limitações, como por exemplo:
- é sensível a valores extremos
- é limitada a situações em que todos os valores são igualmente importantes
- não é adequada para dados do tipo série temporal
Média ponderada da amostra
A média aritmética ponderada, ou média ponderada, é uma generalização da média aritmética que permite definir a contribuição relativa de cada ponto de dados para o resultado.
A média ponderada permite considerar a importância das diferentes contribuições.
Mediana
A mediana é o elemento do meio em um conjunto de dados ordenados. Esse conjunto pode ser ordenado pela ordem crescente ou decrescente.
Se a quantidade de elementos do conjunto de dados for ímpar, então a mediana é o valor da posição do meio: 0.5(n+1).
Se a quantidade de elementos do conjunto de dados for par, então a mediana é a média aritmética dos dois valores do meio, ou seja, os elementos nas posições 0.5n e 0.5n+1.
A mediana é menos suscetível à presença de outliers do que a média.
As vantagens da mediana são que:
- é muito simples de entender e fácil de calcular.
- está no meio de uma série ordenada, então é afetada por valores extremos.
- é especialmente útil em distribuições abertas, pois a posição é o que importa.
As desvantagens são:
- É menos representativa do que a média porque não depende de todos os items da série.
- Não é capaz de receber tratamento algébrico adicional.
- Exemplo: não é possível encontrar a média combinada de grupos diferentes.
Moda
A moda de amostragem é o valor no conjunto de dados que ocorre com mais frequência.
Se não houver um único valor, o conjunto é multimodal, pois tem vários valores modais.
Além do problema de múltiplos modais, a moda pode não fornecer uma boa medida de tendência central, pois o valor mais comum pode estar distante do restante dos dados no conjunto de dados.
Aplicado somente com valores categóricos. Aplicado a dados categóricos em que a categoria mais comum deve ser identificada.
| Tipo de Variável | Melhor medida de tendência central |
|---|---|
| Numérica (não distorcida) | Média |
| Numérica (distorcida) | Mediana |
| Categórica | Moda |
| Ordinal | Mediana |