ETFFIN Finance >> cours Finance personnelle >  >> Financial management >> la finance

Somme des carrés

Quelle est la somme des carrés ?

La somme des carrés est une technique statistique utilisée dans l'analyse de régression pour déterminer la dispersion des points de données. Dans une analyse de régression, l'objectif est de déterminer dans quelle mesure une série de données peut être ajustée à une fonction qui pourrait aider à expliquer comment la série de données a été générée. La somme des carrés est utilisée comme moyen mathématique pour trouver la fonction qui correspond le mieux (varie le moins) à partir des données.

La formule de la somme des carrés est

Pour un ensemble X de m éléments: Somme des carrés = ?? je = 0 m ( X je X ?? ) 2 où: X je = Les je t h élément de l'ensemble X ?? = La moyenne de tous les éléments de l'ensemble ( X je X ?? ) = L'écart de chaque élément par rapport à la moyenne \begin{aligned} &\text{Pour un ensemble } X \text{ of } n \text{ items:}\\ &\text{Somme des carrés}=\sum_{i=0}^{n}\left (X_i-\overline{X}\right)^2\\ &\textbf{where:}\\ &X_i=\text{Le } i^{th} \text{ élément de l'ensemble}\\ &\overline{ X}=\text{La moyenne de tous les éléments de l'ensemble}\\ &\left(X_i-\overline{X}\right) =\text{L'écart de chaque élément par rapport à la moyenne}\\ \end{aligned } ​Pour un ensemble X de n éléments :Somme des carrés=i=0∑n​(Xi​−X)2où :Xi​=Le ième élément de l'ensembleX=La moyenne de tous les éléments de l'ensemble(Xi​−X )=L'écart de chaque élément par rapport à la moyenne​

La somme des carrés est aussi appelée variation.

Que vous dit la somme des carrés ?

La somme des carrés est une mesure de l'écart par rapport à la moyenne. En statistiques, la moyenne est la moyenne d'un ensemble de nombres et est la mesure de tendance centrale la plus couramment utilisée. La moyenne arithmétique est simplement calculée en additionnant les valeurs de l'ensemble de données et en divisant par le nombre de valeurs.

Disons que les cours de clôture de Microsoft (MSFT) au cours des cinq derniers jours étaient de 74,01, 74.77, 73.94, 73.61, et 73,40 en dollars américains. La somme des prix totaux est de 369,73 $ et le prix moyen ou moyen du manuel serait donc de 369,73 $ / 5 =73,95 $.

Mais connaître la moyenne d'un ensemble de mesures ne suffit pas toujours. Parfois, il est utile de savoir combien il y a de variation dans un ensemble de mesures. L'écart entre les valeurs individuelles et la moyenne peut donner une idée de l'adéquation des observations ou des valeurs au modèle de régression créé.

Par exemple, si un analyste voulait savoir si le cours de l'action MSFT évolue en parallèle avec le cours d'Apple (AAPL), il peut lister l'ensemble des observations pour le processus des deux stocks pendant une certaine période, dire 1, 2, ou 10 ans et créer un modèle linéaire avec chacune des observations ou mesures enregistrées. Si la relation entre les deux variables (c'est-à-dire, le prix de l'AAPL et le prix du MSFT) n'est pas une ligne droite, alors il y a des variations dans l'ensemble de données qui doivent être examinées minutieusement.

Dans les statistiques parlent, si la ligne dans le modèle linéaire créé ne passe pas par toutes les mesures de valeur, alors une partie de la variabilité qui a été observée dans les cours des actions est inexpliquée. La somme des carrés est utilisée pour calculer s'il existe une relation linéaire entre deux variables, et toute variabilité inexpliquée est appelée somme des carrés résiduelle.

La somme des carrés est la somme du carré de la variation, où la variation est définie comme l'écart entre chaque valeur individuelle et la moyenne. Pour déterminer la somme des carrés, la distance entre chaque point de données et la ligne de meilleur ajustement est mise au carré puis additionnée. La ligne de meilleur ajustement minimisera cette valeur.

Comment calculer la somme des carrés

Vous pouvez maintenant voir pourquoi la mesure s'appelle la somme des écarts au carré, ou la somme des carrés pour faire court. En utilisant notre exemple MSFT ci-dessus, la somme des carrés peut être calculée comme :

  • SS =(74,01 - 73,95) 2 + (74,77 - 73,95) 2 + (73,94 - 73,95) 2 + (73,61 - 73,95) 2 + (73,40 - 73,95) 2
  • SS =(0,06) 2 + (0,82) 2 + (-0,01) 2 + (-0,34) 2 + (-0,55) 2
  • SS =1,0942

L'addition de la somme des écarts seuls sans élévation au carré donnera un nombre égal ou proche de zéro puisque les écarts négatifs compenseront presque parfaitement les écarts positifs. Pour obtenir un nombre plus réaliste, la somme des écarts doit être au carré. La somme des carrés sera toujours un nombre positif car le carré de n'importe quel nombre, qu'elles soient positives ou négatives, est toujours positif.

Exemple d'utilisation de la somme des carrés

Sur la base des résultats du calcul MSFT, une somme des carrés élevée indique que la plupart des valeurs sont plus éloignées de la moyenne, et donc, il y a une grande variabilité dans les données. Une somme des carrés faible fait référence à une faible variabilité dans l'ensemble d'observations.

Dans l'exemple ci-dessus, 1.0942 montre que la variabilité du cours de l'action MSFT au cours des cinq derniers jours est très faible et que les investisseurs cherchant à investir dans des actions caractérisées par la stabilité des prix et une faible volatilité peuvent opter pour MSFT.

Points clés à retenir

  • La somme des carrés mesure l'écart des points de données par rapport à la valeur moyenne.
  • Un résultat de somme des carrés plus élevé indique un degré élevé de variabilité au sein de l'ensemble de données, tandis qu'un résultat inférieur indique que les données ne varient pas considérablement de la valeur moyenne.

Limitations de l'utilisation de la somme des carrés

Prendre une décision d'investissement sur les actions à acheter nécessite beaucoup plus d'observations que celles énumérées ici. Un analyste peut avoir à travailler avec des années de données pour savoir avec une plus grande certitude à quel point la variabilité d'un actif est élevée ou faible. Au fur et à mesure que d'autres points de données sont ajoutés à l'ensemble, la somme des carrés augmente au fur et à mesure que les valeurs seront plus dispersées.

Les mesures de variation les plus largement utilisées sont l'écart type et la variance. Cependant, pour calculer l'une des deux métriques, la somme des carrés doit d'abord être calculée. La variance est la moyenne de la somme des carrés (c'est-à-dire la somme des carrés divisée par le nombre d'observations). L'écart type est la racine carrée de la variance.

Il existe deux méthodes d'analyse de régression qui utilisent la somme des carrés :la méthode des moindres carrés linéaires et la méthode des moindres carrés non linéaires. La méthode des moindres carrés fait référence au fait que la fonction de régression minimise la somme des carrés de la variance par rapport aux points de données réels. De cette façon, il est possible de dessiner une fonction qui fournit statistiquement le meilleur ajustement pour les données. Notez qu'une fonction de régression peut être linéaire (une ligne droite) ou non linéaire (une ligne courbe).