Machine Learning - Index

Métricas de Desempenho em Classificação Binária

Na classificação binária, a avaliação do desempenho do modelo é fundamental. As métricas comumente usadas são derivadas da matriz de confusão, que inclui True Positives (TP), True Negatives (TN), False Positives (FP) e False Negatives (FN). Aqui estão algumas métricas chave:

1. Acurácia (Accuracy):

  • Proporção de previsões corretas (TP + TN) em relação ao total de casos (TP + TN + FP + FN).
  • É útil quando as classes do alvo são aproximadamente balanceadas.
  • Não é adequada para conjuntos de dados desbalanceados, como a detecção de câncer onde apenas uma pequena proporção pode ter a doença.

2. Recall ou Sensibilidade (Sensitivity):

  • Proporção de casos positivos reais que são corretamente previstos como positivos (TP / (TP + FN)).
  • É útil para identificar a capacidade do modelo de detectar casos positivos.

3. Especificidade (Specificity):

  • Proporção de casos negativos reais que são corretamente previstos como negativos (TN / (TN + FP)).
  • É importante para avaliar a capacidade do modelo de detectar corretamente casos negativos.

4. Precisão (Precision):

  • Proporção dos casos positivos previstos que são realmente positivos (TP / (TP + FP)).
  • É útil para entender a proporção de previsões positivas que são corretas.

A otimização simultânea de sensibilidade e especificidade é uma estratégia comum para avaliar um classificador binário. A média geométrica dessas duas métricas oferece uma métrica de avaliação de um único número que permite classificar diferentes modelos de acordo com o desempenho (identificação do melhor modelo).

  • Média Geométrica (Geometric Mean):
    • Combina sensibilidade e especificidade para fornecer uma métrica de avaliação única.
    • Ideal para classificadores binários, pois leva em conta tanto a capacidade de identificar casos positivos quanto a de identificar corretamente casos negativos.

O ideal para um classificador é ter tanto a sensibilidade quanto a especificidade de 100%, indicando uma capacidade perfeita de identificar corretamente tanto os casos positivos quanto os negativos.

No entanto, na prática, pode ser necessário fazer um trade-off entre essas duas métricas, dependendo da importância relativa de minimizar falsos positivos ou falsos negativos no contexto específico da aplicação.

As métricas de desempenho em classificação binária são essenciais para entender a eficácia de um modelo em identificar corretamente as duas classes. A escolha da métrica mais apropriada dependerá do problema específico, do conjunto de dados e dos objetivos da análise.