Classificação Binária: Avaliação de Desempenho
Em problemas de classificação binária, o objetivo é atribuir uma instância a uma de duas categorias com base em um conjunto de atributos ou características.
Exemplos incluem diagnóstico médico (doença vs. sem doença), filtro de spam (spam vs. não spam), controle de qualidade na indústria (bom vs. não bom), controle de tráfego (livre vs. não livre) e avaliação de preços de casas (regular vs. superfaturada).
Na classificação binária, a saída real de muitos algoritmos é uma pontuação ou valor de previsão. Uma instância deve ser classificada como positiva ou negativa se o valor estiver acima ou abaixo de um limiar de classificação/decisão.
Matriz de Confusão e Métricas de Desempenho
A matriz de confusão é fundamental para avaliar o desempenho de modelos de classificação.
Ela é aplicada a problemas de classificação onde a saída pode ser de dois ou mais tipos de classes e é a base para derivar várias métricas aplicadas à classificação:
- TP (True Positive): Casos em que a classe real é positiva e a previsão também é positiva.
- TN (True Negative): Casos em que a classe real é negativa e a previsão também é negativa.
- FP (False Positive): Casos em que a classe real é negativa, mas a previsão é positiva (erro do Tipo I).
- FN (False Negative): Casos em que a classe real é positiva, mas a previsão é negativa.

A matriz de confusão é uma ferramenta valiosa para entender como um modelo de classificação está se saindo, particularmente em termos de sua capacidade de distinguir entre as duas classes.
As métricas derivadas da matriz de confusão, como precisão, recall e a área sob a curva ROC (AUC-ROC), são usadas para fornecer uma avaliação mais completa do desempenho do modelo.