martes, 4 de agosto de 2020

Regresión Lineal y Coeficiente de correlación

Correlación Lineal

A continuación, se mostrarán los pasos para realizar una regresión lineal de varios puntos de muestreo, así como también el cálculo del coeficiente de correlación.

El objetivo es que con esta información sea posible correlacionar puntos (o datos) en un plano de 2 dimensiones, con el método de regresión lineal.

Introducción

Los conocimientos básicos para entender y desarrollar este proceso son los siguientes:

Línea recta. Por línea recta se entiende a la distancia más corta entre dos puntos en un plano de dos dimensiones (plano cartesiano). También se puede describir a una línea recta como una sucesión continua de puntos extendidos en una sola dirección.

Al tener una línea recta en un plano cartesiano obtenemos las siguientes ecuaciones:

Ecuación de una línea recta forma PENDIENTE-INTERSECCIÓN

 
y    Valores de referencia, son datos que su valor es conocido.
b    Punto por el cual la línea recta cruza por el eje “y”.
m   Pendiente de la recta (usualmente se utiliza la letra m), que es la inclinación de la línea recta                   respecto al eje “x”.
x    Valores obtenidos para linealizar.

Ecuación de la PENDIENTE

 


Promedio. Media aritmética de un conjunto finitos de datos. También se define como el mejor estimado de un conjunto finito de datos.
 


N Número total de datos

Desviación típica. Es una medida que se emplea para cuantificar la variación o la dispersión de un conjunto finitos de datos numéricos.


Covarianza. Es un valor que indica el grado de variación conjunta de dos variables (valores de referencia y valores de análisis) respecto a sus medias.

 

Procedimiento para realiza una correlación de datos (regresión lineal)

Primer paso. Organizar los datos en dos columnas, una columna de datos de referencia que estarán en el eje “y”, y en la segunda columna los datos medidos que se colocarán en el eje “x”.

 (x)           (y)
 
2.00         0.00
8.00         10.00
23.00 20.00
27.00 30.00
45.00 40.00
52.00 50.00
65.00 60.00
66.00 70.00
77.00 80.00
88.00 90.00

Segundo paso. Graficar los datos del eje “x” y del eje “y”.
 
 
 
Tercer paso. Calcular el promedio de ambos ejes.
 
 
 
 

 
 
  

Cuarto paso. Calcular la pendiente.
 
 
 
 
 

 


Quinto paso. Calcular la intersección de la línea recta en el eje “y”.
 

 
Sexto paso. Determinar la ecuación de la correlación lineal.
 

 
Donde x serán los datos obtenidos inicialmente. “ŷ” es el valor linealizado para graficar la línea recta.

Séptimo paso. Colocar los datos del eje “x” iniciales y con la ecuación obtenida para correlacionar los datos (Ecuación 9), obtener los datos del eje “y” correlacionados.

(x)            (y)            (ŷ)

2.00         0.00        0.72
8.00         10.00 6.85
23.00 20.00 22.19
27.00 30.00 26.28
45.00 40.00 44.69
52.00 50.00 51.85
65.00 60.00 65.15
66.00 70.00 66.17
77.00 80.00 77.42
88.00 90.00 88.67

Octavo paso. Graficar los datos del eje “x” con los datos obtenidos por la ecuación de correlación (ecuación 9).
 

El resultado final es una serie de datos que al graficarse en conjunto con los valores iniciales del eje “x”, forma una línea recta que correlaciona a los puntos dispersos iniciales.

Coeficiente de correlación r.

El coeficiente de correlación Pearson es una medida de dependencia lineal entre dos variables aleatorias cuantitativas.

Procedimiento para calcular el coeficiente de correlación.

Primer paso. Indicar los datos correspondientes para el eje “x” y el eje “y”.

 (x)           (y)
 
2.00         0.00
8.00         10.00
23.00 20.00
27.00 30.00
45.00 40.00
52.00 50.00
65.00 60.00
66.00 70.00
77.00 80.00
88.00 90.00

Segundo paso. Agregar una nueva columna multiplicando cada valor del eje “x” con el valor correspondiente del eje “y”.

(x)            (y)           X*Y
2.00         0.00          0
8.00         10.00 80
23.00 20.00 460
27.00 30.00 810
45.00 40.00 1800
52.00 50.00 2600
65.00 60.00 3900
66.00 70.00 4620
77.00 80.00 6160
88.00 90.00 7920

Tercer paso. Agregar una nueva columna del cuadrado de cada valor del eje “x” y el cuadrado de cada labor del eje “y”.

(x)            (y)           X*Y        X^2        Y^2
2.00         0.00         0          4         
8.00         10.00 80         64         100
23.00 20.00 460         529         400
27.00 30.00 810         729         900
45.00 40.00 1800 2025 1600
52.00 50.00 2600 2704 2500
65.00 60.00 3900 4225 3600
66.00 70.00 4620 4356 4900
77.00 80.00 6160 5929 6400
88.00 90.00 7920 7744 8100

Cuarto paso. Calcular el promedio del eje “x” y del eje “y”.


 
 

 
Quinto paso. Agregar una fila con la suma de cada columna.

(x)            (y)            X*Y        X^2        Y^2
2.00         0.00         0              4       0
8.00         10.00 80             64 100
23.00 20.00 460           529 400
27.00 30.00 810           729 900
45.00 40.00 1800 2025 1600
52.00 50.00 2600 2704 2500
65.00 60.00 3900 4225 3600
66.00 70.00 4620 4356 4900
77.00 80.00 6160 5929 6400
88.00 90.00 7920 7744 8100
453.00 450.00 28350    28309 28500

Sexto paso. Calcular la covarianza entre los valores del eje “x” y del eje “y”.



Séptimo paso. Calcular la desviación típica de los valores del eje “x” y del eje “y”.




Octavo paso. Calcular el coeficiente de correlación.



Interpretación del coeficiente de correlación.

r = 1. Correlación positiva perfecta.
0 < r < 1. Correlación positiva.
r = 0. Sin correlación lineal
-1 < r < 0. Correlación negativa.
r = -1.         Correlación negativa perfecta.




No hay comentarios.:

Publicar un comentario

Regresión Lineal y Coeficiente de correlación

Correlación Lineal A continuación, se mostrarán los pasos para realizar una regresión lineal de varios puntos de muestreo, así como también ...