Machine Learning - Index

Naïve Bayes

Naïve Bayes é um classificador probabilístico baseado no Teorema de Bayes. É frequentemente usado em tarefas de classificação e é conhecido por sua simplicidade e eficiência computacional, especialmente em grandes conjuntos de dados. Naïve Bayes assume uma forte independência condicional entre as características.

Probabilidades no Naïve Bayes:

  • Probabilidade Marginal: Probabilidade de um evento independente dos resultados de outras variáveis. Exemplo: A probabilidade de uma carta ser vermelha é de 0,5.
  • Probabilidade Conjunta: Probabilidade de dois ou mais eventos simultâneos. Exemplo: A probabilidade de uma carta ser um quatro e vermelha.
  • Probabilidade Condicional: Probabilidade de um evento dado outro. Exemplo: A probabilidade de uma carta ser um quatro, dado que ela é vermelha.

Classificação Baseada na Regra de Bayes:

  • O classificador Naïve Bayes usa a Regra de Bayes para atribuir um rótulo de classe a uma instância com base em um conjunto de atributos. A classe com a maior probabilidade posterior, dada a observação, é escolhida como a previsão final.
  • O modelo calcula a probabilidade de cada classe com base nos atributos da instância e seleciona a classe com a maior probabilidade.

Características do Naïve Bayes:

  • Configuração de Rede Bayesiana: Naïve Bayes assume uma rede bayesiana particular, com um nó de destino (não observado) e vários filhos (nós observados/atributos).
  • Eficiência Computacional: Naïve Bayes é eficiente do ponto de vista computacional e pode lidar com informações incompletas.
  • Independência Condicional: O modelo pressupõe independência condicional entre os atributos, o que simplifica os cálculos, mas pode ser uma suposição irrealista em certos casos.

Exemplo Prático:

Imagine um sistema de diagnóstico médico que utiliza o Naïve Bayes para prever se um paciente tem uma determinada doença com base em resultados de exames clínicos. O modelo calcularia a probabilidade de o paciente ter a doença com base na combinação dos resultados dos exames e nas informações prévias sobre a prevalência da doença.

Em resumo, o Naïve Bayes é um método eficaz e eficiente para tarefas de classificação, especialmente quando a suposição de independência condicional entre os atributos é razoavelmente válida. É amplamente utilizado em aplicações como filtragem de spam, diagnóstico médico e classificação de texto.