Estatística Descritiva

As medidas de tendência central mostram os valores centrais ou médios do conjunto de dados

Uma medida de tendência central é um valor único que tenta descrever um conjunto de dados identificando a posição central dentro desse conjunto de dados.

Média

Média da amostra

A média aritmética da amostra, ou simplesmente a média, é a média aritmética de todos os itens em um conjunto de dados.

É representada matematicamente da seguinte forma:

A média aritmética como medida de tendência central é simples e fácil de usar. Porém, ela tem desvantagens e limitações, como por exemplo:

  • é sensível a valores extremos
  • é limitada a situações em que todos os valores são igualmente importantes
  • não é adequada para dados do tipo série temporal

Média ponderada da amostra

A média aritmética ponderada, ou média ponderada, é uma generalização da média aritmética que permite definir a contribuição relativa de cada ponto de dados para o resultado.

A média ponderada permite considerar a importância das diferentes contribuições.

Mediana

A mediana é o elemento do meio em um conjunto de dados ordenados. Esse conjunto pode ser ordenado pela ordem crescente ou decrescente.

Se a quantidade de elementos do conjunto de dados for ímpar, então a mediana é o valor da posição do meio: 0.5(n+1).

Se a quantidade de elementos do conjunto de dados for par, então a mediana é a média aritmética dos dois valores do meio, ou seja, os elementos nas posições 0.5n e 0.5n+1.

A mediana é menos suscetível à presença de outliers do que a média.

As vantagens da mediana são que:

  • é muito simples de entender e fácil de calcular.
  • está no meio de uma série ordenada, então é afetada por valores extremos.
  • é especialmente útil em distribuições abertas, pois a posição é o que importa.

As desvantagens são:

  • É menos representativa do que a média porque não depende de todos os items da série.
  • Não é capaz de receber tratamento algébrico adicional.
    • Exemplo: não é possível encontrar a média combinada de grupos diferentes.

Moda

A moda de amostragem é o valor no conjunto de dados que ocorre com mais frequência.

Se não houver um único valor, o conjunto é multimodal, pois tem vários valores modais.

Além do problema de múltiplos modais, a moda pode não fornecer uma boa medida de tendência central, pois o valor mais comum pode estar distante do restante dos dados no conjunto de dados.

Aplicado somente com valores categóricos. Aplicado a dados categóricos em que a categoria mais comum deve ser identificada.

Tipo de VariávelMelhor medida de tendência central
Numérica (não distorcida)Média
Numérica (distorcida)Mediana
CategóricaModa
OrdinalMediana