Introduction à la régression logistique et ses principes 逻辑回归及其原理介绍

     J'ai parlé de la régression linéaire, une méthode très utile pour prévoir le résultat basé sur les facteurs fourni, dans le blog précédent. Et un peu plus loin, je vais montrer la régression logistique aujourd'hui.

    C'est quoi la régression logistique ? C'est quoi la différent entre la régression logistique et linéaire ? En termes d'utilisation, la régression linéaire viser sur la prévision et la régression logistique viser sur le classement. La modèle de régression linéaire sort des valeurs numériques continues tandis que la modèle de régression logistique produit des étiquettes non continues.

    Quant à les problèmes de classification binaire, la régression logistique évalue la probabilité de l'appartenance de certain échantillon. Tout d'abord, je veux parler de la fonction sigmoïde.


    Mais pourquoi et comment on l'utilise ?

    Si la valeur supérieure à 0.5, on le marquerait comme "1", et au contraire, on le marquerait comme "0". Puisque c'est une classification binaire, on les marque simplement comme "0" et "1". 

    Ce n'est qu'une fonction montante la classe de la valeur. Le rôle de la fonction sigmoïde dans la classification par régression logistique est de prédire la probabilité de classification. Nous avons également besoin d'une frontière de décision pour classer.


    La frontière de décision est une ligne qui divise les données. Il n'existe pas vraiment, mais nous le déduisons sur la base des données dont nous disposons.

   Si c'est une ligne droite, bien sûr la fonction de la frontière est:  theta0 + theta1x1 + theta2x2 = 0. Les points sur cette ligne ont des valeurs g(x) supérieures à 0.
    Dans certains cas, nous utiliserons d'autres limites de décision. Par exemple, si l'objet que nous classons est à l'intérieur ou à l'extérieur d'un certain cercle, nous utilisons l'équation d'un cercle. Notre travail consiste donc à trouver les valeurs de thêta0, thêta1 et thêta2 en fonction des échantillons d'apprentissage. 
   Bien sûr, le calcul de la régression logistique doit également utiliser la méthode de descente de gradient pour trouver la fonction de perte minimale. 
    Parce que dans les problèmes de classification, les étiquettes et les prédictions sont des points discrets, la fonction de perte minimale utilisant la régression linéaire ne peut pas trouver le point minimum, nous utiliserons une autre équation. Dans les étapes générales, la régression logistique pour trouver la fonction de perte minimale est la même que la régression linéaire pour trouver la fonction de perte minimale. Si vous êtes intéressé, vous pouvez consulter mon précédent blog.


评论