Utilisation de la régression linéaire pour prévoir les résultats 使用线性回归预测结果

     Connaissances en mathématiques requises :

    C'est quoi l'analyse de régression ?

-L'analyse des données disponibles permet de déterminer la relation quantitative entre les variables en question, qui sont interdépendantes.

Régression unaire : y = f(x)

Régression multiple : y = f(x1,x2,x3...,xn)

Régression linéaire : y = ax + b

Régression non linéaire : y = ax² + bx + c

Par exemple:

    La loi de procédure pénale chinoise prévoit la "取保候审(libération sous caution en attendant le procès)", cependant, dans le passé, ce système était peu utilisé et uniquement appliqué à un petit nombre de personnes au pouvoir. Durant l'épidémie de coronavirus, l'exigence politique de "patient zéro" a conduit à un renforcement de l'utilisation de cette mesure afin d'éviter la propagation du virus en détention. Ainsi, en utilisant la régression linéaire, il est possible d'étudier la relation entre le nombre d'infections en Chine, l'impact de la politique de "patient zéro" et d'autres facteurs sur l'évolution du ratio de caution.

Mathématiques requises de régression linéaire:

    Contrairement à la compréhension humaine, les ordinateurs ne sont pas naturellement aptes à comprendre les mathématiques. Pour résoudre des problèmes mathématiques simples, il est donc nécessaire de recourir à des algorithmes sophistiqués pour permettre aux ordinateurs de les calculer.

    Dans ce type de problème, le résultat souhaité est la détermination de l'équation linéaire y = ax + b. Mais comment trouver le "a" et le "b" les plus adaptés ?

    Résultat prévisionnel :y' = ax + b

    Supposons que x est une variable, y est le résultat correspondant et y' est le résultat de la sortie du modèle. Le but est : y' est aussi proche que possible de y.

    

m est le nombre d'échantillons


    Pour la commodité des calculs dérivés ultérieurs, la formule entière est divisée par 2m, qui est la fonction de perte J (损失函数J). Comme le minimum est relatif, cela ne change pas le résultat. Ainsi, notre objectif est de rendre J aussi petit que possible.

    

    En substituant la formule de y'i, nous pouvons l'abstraire en une fonction g autour de a et b à ce moment. Mais comment trouver la valeur minimale de J ?
    La Descente de Gradient (梯度下降法)est utilisée ici. 
        La descente de gradient est une méthode pour trouver des minima. Recherchez de manière itérative le point de distance de pas spécifié dans la direction opposée du gradient (ou du gradient approximatif) correspondant au point actuel sur la fonction jusqu'à ce qu'il converge au point minimum.

    



    Lorsque le "cost" (fonction de perte) dans la figure prend la valeur minimale, nous pouvons obtenir a et b avec le meilleur effet d'ajustement.
    Dans un ordinateur, nous utiliserions cette méthode pour calculer à plusieurs reprises jusqu'à la convergence

    Je ne suis pas un expert en mathématiques, Je ne peux pas fournir d'explication mathématique. Notre but ici est de profiter des méthodes fournies par les mathématiciens, il suffit donc de savoir s'en servir.

    Dans le prochain blog, je montrerai le code de régression linéaire. Heureusement, nous pouvons utiliser des outils mathématiques fournis par d'autres sans nous soucier des détails des calculs mathématiques.

En question 前面提到的

quantitative 定量的,定量分析

Interdépendante 相互依存的,相互依赖的

评论