martes, 4 de agosto de 2020

Regresión Lineal y Coeficiente de correlación

Correlación Lineal

A continuación, se mostrarán los pasos para realizar una regresión lineal de varios puntos de muestreo, así como también el cálculo del coeficiente de correlación.

El objetivo es que con esta información sea posible correlacionar puntos (o datos) en un plano de 2 dimensiones, con el método de regresión lineal.

Introducción

Los conocimientos básicos para entender y desarrollar este proceso son los siguientes:

Línea recta. Por línea recta se entiende a la distancia más corta entre dos puntos en un plano de dos dimensiones (plano cartesiano). También se puede describir a una línea recta como una sucesión continua de puntos extendidos en una sola dirección.

Al tener una línea recta en un plano cartesiano obtenemos las siguientes ecuaciones:

Ecuación de una línea recta forma PENDIENTE-INTERSECCIÓN

 
y    Valores de referencia, son datos que su valor es conocido.
b    Punto por el cual la línea recta cruza por el eje “y”.
m   Pendiente de la recta (usualmente se utiliza la letra m), que es la inclinación de la línea recta                   respecto al eje “x”.
x    Valores obtenidos para linealizar.

Ecuación de la PENDIENTE

 


Promedio. Media aritmética de un conjunto finitos de datos. También se define como el mejor estimado de un conjunto finito de datos.
 


N Número total de datos

Desviación típica. Es una medida que se emplea para cuantificar la variación o la dispersión de un conjunto finitos de datos numéricos.


Covarianza. Es un valor que indica el grado de variación conjunta de dos variables (valores de referencia y valores de análisis) respecto a sus medias.

 

Procedimiento para realiza una correlación de datos (regresión lineal)

Primer paso. Organizar los datos en dos columnas, una columna de datos de referencia que estarán en el eje “y”, y en la segunda columna los datos medidos que se colocarán en el eje “x”.

 (x)           (y)
 
2.00         0.00
8.00         10.00
23.00 20.00
27.00 30.00
45.00 40.00
52.00 50.00
65.00 60.00
66.00 70.00
77.00 80.00
88.00 90.00

Segundo paso. Graficar los datos del eje “x” y del eje “y”.
 
 
 
Tercer paso. Calcular el promedio de ambos ejes.
 
 
 
 

 
 
  

Cuarto paso. Calcular la pendiente.
 
 
 
 
 

 


Quinto paso. Calcular la intersección de la línea recta en el eje “y”.
 

 
Sexto paso. Determinar la ecuación de la correlación lineal.
 

 
Donde x serán los datos obtenidos inicialmente. “ŷ” es el valor linealizado para graficar la línea recta.

Séptimo paso. Colocar los datos del eje “x” iniciales y con la ecuación obtenida para correlacionar los datos (Ecuación 9), obtener los datos del eje “y” correlacionados.

(x)            (y)            (ŷ)

2.00         0.00        0.72
8.00         10.00 6.85
23.00 20.00 22.19
27.00 30.00 26.28
45.00 40.00 44.69
52.00 50.00 51.85
65.00 60.00 65.15
66.00 70.00 66.17
77.00 80.00 77.42
88.00 90.00 88.67

Octavo paso. Graficar los datos del eje “x” con los datos obtenidos por la ecuación de correlación (ecuación 9).
 

El resultado final es una serie de datos que al graficarse en conjunto con los valores iniciales del eje “x”, forma una línea recta que correlaciona a los puntos dispersos iniciales.

Coeficiente de correlación r.

El coeficiente de correlación Pearson es una medida de dependencia lineal entre dos variables aleatorias cuantitativas.

Procedimiento para calcular el coeficiente de correlación.

Primer paso. Indicar los datos correspondientes para el eje “x” y el eje “y”.

 (x)           (y)
 
2.00         0.00
8.00         10.00
23.00 20.00
27.00 30.00
45.00 40.00
52.00 50.00
65.00 60.00
66.00 70.00
77.00 80.00
88.00 90.00

Segundo paso. Agregar una nueva columna multiplicando cada valor del eje “x” con el valor correspondiente del eje “y”.

(x)            (y)           X*Y
2.00         0.00          0
8.00         10.00 80
23.00 20.00 460
27.00 30.00 810
45.00 40.00 1800
52.00 50.00 2600
65.00 60.00 3900
66.00 70.00 4620
77.00 80.00 6160
88.00 90.00 7920

Tercer paso. Agregar una nueva columna del cuadrado de cada valor del eje “x” y el cuadrado de cada labor del eje “y”.

(x)            (y)           X*Y        X^2        Y^2
2.00         0.00         0          4         
8.00         10.00 80         64         100
23.00 20.00 460         529         400
27.00 30.00 810         729         900
45.00 40.00 1800 2025 1600
52.00 50.00 2600 2704 2500
65.00 60.00 3900 4225 3600
66.00 70.00 4620 4356 4900
77.00 80.00 6160 5929 6400
88.00 90.00 7920 7744 8100

Cuarto paso. Calcular el promedio del eje “x” y del eje “y”.


 
 

 
Quinto paso. Agregar una fila con la suma de cada columna.

(x)            (y)            X*Y        X^2        Y^2
2.00         0.00         0              4       0
8.00         10.00 80             64 100
23.00 20.00 460           529 400
27.00 30.00 810           729 900
45.00 40.00 1800 2025 1600
52.00 50.00 2600 2704 2500
65.00 60.00 3900 4225 3600
66.00 70.00 4620 4356 4900
77.00 80.00 6160 5929 6400
88.00 90.00 7920 7744 8100
453.00 450.00 28350    28309 28500

Sexto paso. Calcular la covarianza entre los valores del eje “x” y del eje “y”.



Séptimo paso. Calcular la desviación típica de los valores del eje “x” y del eje “y”.




Octavo paso. Calcular el coeficiente de correlación.



Interpretación del coeficiente de correlación.

r = 1. Correlación positiva perfecta.
0 < r < 1. Correlación positiva.
r = 0. Sin correlación lineal
-1 < r < 0. Correlación negativa.
r = -1.         Correlación negativa perfecta.




Fracciones Parciales

 Fracciones parciales.

A continuación, se mostrarán las formas de cocientes de polinomios y algunas características, teniendo como variable la letra “s” para poder acostumbrarse a los temas de sistemas de control, aunque se puede cambiar la variable “s” por la letra que sea mas entendible.

Conceptos preliminares

Una forma para sumar fracciones con denominadores distintos es:

Paso 1.

Multiplicar el numerador “a” por el denominador “d” y colocar su resultado en un nuevo numerador junto con el signo de operación entre ambas fracciones.

Paso 2.

Multiplicar el denominador “b” por el numerador “c” y colocar su resultado al lado derecho del resultado del paso 1.

Paso 3.

Multiplicar el denominador “b” por el denominador “d” y colocar el resultado como el nuevo denominador de la nueva fracción creada en el paso 1.

Paso 4.

Sumas los productos que se encuentran en la parte del numerador.

Paso 5.

Obtener el mínimo común múltiplo tanto para el numerador como para el denominador.

Ejemplo 1

Paso 1.

Paso 2.

Paso 3.

Paso 4.

Paso 5.

Como 13 es un numero primo es evidente que no se puede realizar una simplificación. Por lo tanto, es lo mismo operar con (13/6) que con (1/2 + 5/3).

Por lo tanto, una fracción se puede descomponer en suma de otras fracciones.

Fracción propia.

Una fracción es propia cuando el grado del numerador es menor al grado del denominador.


Fracción impropia.

Una fracción es impropia cuando el grado del numerador es menor al grado del denominador.


Caso 1. El denominador A(s) se puede descomponer en factores lineales distintos. (Polos distintos)

Si este es el caso del cociente que se tenga, se puede descomponer de la siguiente manera:

Para determinar el valor de las constantes A1, A2, …, An se puede realizar lo siguiente:

Ejemplo 2.

Descomponer en fracciones parciales la siguiente fracción;

Paso 1. Volver a colocar el numerador tal y como esta y en el denominador colocamos un par de paréntesis.

Paso 2. Se obtiene la raíz cuadrada de la variable elevada al cuadrado. El resultado se coloca en cada paréntesis.

Paso 3. Se determina el signo de los factores. Si en el polinomio los signos de la variable lineal y la constante son positivos los factores tendrán signos positivos. Y se agregan las raíces s1 y s2.

Paso 4. Vamos a encontrar s1 y s2 de la siguiente manera:

Dos números que sumados den 3 y multiplicados den 2.

Por lo tanto  

Reescribimos la fracción con las raíces que se acaban de encontrar.

Ya tenemos al denominador descompuesto en factores lineales diferentes. Ahora procedemos a descomponer toda la fracción en suma de otras fracciones.

 

El siguiente paso es encontrar A1 y A2.

Por lo tanto, A1 = 2 y A2 =-1.

Reescribimos la fracción.

Comprobación:

Otra manera de determinar las constantes A1 y A2 es:

En la última ecuación vamos a comparar los valores correspondientes de las variables y las constantes.

Por lo tanto, podemos escribir el sistema de ecuaciones determinado de la siguiente manera:

Para encontrar A1 y A2 se puede emplear el método que resulte más fácil, para este caso usaremos el método por determinantes.

El primer paso es obtener el determinante del sistema de ecuaciones.

Posteriormente hay que obtener el determinante de A1.

Despues se debe calcular el determinante de A2.

Una vez que se tienen los valores de Delta, delta A1 y delta A2, se procede a calcular los valores de A1 y A2.

Se puede emplear el método que resulte más fácil de usar para determinar las constantes.

Caso 2. El denominador A(s) se puede descomponer en factores lineales y unos se repiten (Polos múltiples)

Si el denominador se puede descomponer los factores de la forma:

Ejemplo 3.

Descomponer en fracciones parciales el siguiente polinomio:

Se debe agregar una fracción por cada nivel del denominador de forma individual hasta llegar a la enésima potencia.

Para determinar las constantes A1, A2 y A3 se proponen 2 manera diferentes.

Primer método para determinar constantes de fracciones parciales polos múltiples:

Para calcular A3 se realiza lo siguiente:

Para calcular A2 se realiza lo siguiente:

Para calcular A1 se calcula lo siguiente:

Se reescribe la fracción:

Segundo método para determinar constantes de fracciones parciales polos múltiples:

En este punto se debe desarrollar la resolución de los potenciales y paréntesis.

Ahora se comparan los valores correspondientes entre ambos lados de la igualdad.

Al sustituir A1 en la segunda ecuación se tiene:

Al sustituir A1 y A2 en la ecuación 3 se tiene:

Al reescribir la fracción se tiene:

Caso 3. Factores cuadráticos irreductibles ninguno se repite.

Si el denominador A(s) tiene factores cuadráticos que no se pueden reducir de la forma:

La fracción equivalente tendrá la forma:

Ejemplo:

Descomponer en fracciones parciales la siguiente fracción:

Primero se debe desarrollar en lo posible al denominador:

Una vez que el denominador no puede reducirse más, se procede a descomponerlo en fracciones parciales:

En este punto se procede a desarrollar las variables para poder obtener un sistema de ecuaciones y así determinar los valores de las contantes para completar el desarrollo en fracciones parciales de la fracción inicial.

El resultado nos da un sistema de ecuaciones de 3 variables.

Existen diversos métodos para determinar estos valores.

Se determinaron los valores para A, B y C por el método de determinantes y los valores son:

Al sustituir estos valores queda lo siguiente:

Forma 4. El denominador contiene un factor irreductible repetido.

El denominador A(s) se puede descomponer en factores cuadráticos repetidos.

 

Se obtiene el siguiente sistema de ecuaciones:

Se procede a encontrar el valor de cada constante:

Y estos son los resultados:

Se reescribe la fracción:



Regresión Lineal y Coeficiente de correlación

Correlación Lineal A continuación, se mostrarán los pasos para realizar una regresión lineal de varios puntos de muestreo, así como también ...