Tema 12. Concordancia y correlación. Correlación paramétrica: pearson. Correlación no paramétrica: Spearman

1.       RELACIONES ENTRE VARIABLES Y REGRESIÓN 
El termino refresco fue introducido por Galton en su libro “Natural inheritance” 1889 refiriéndose a la “ey del refresco universal. 
   Cada peculiaridad en un hombre es compartida por sus descendientes, pero en medida, en un grado menor. 
        Regresión a la media 
   Su trabajo se centraba en la descripción de los lagos físicos de los descendientes (una variable) a partir de los de sus padres (otra variable) 
   Pearson (un amigo suyo) realizó un estudio con mas de 100 registros de grupos familiares observando una relación del tipo:
   Altura del hijo = 85cm + 0,5 altura del padre (aprox.) 
   Conclusión: los padres muy altos tienen tendencia a tener hijos que heredan parte de esta altura, aunque tienen tendencia a acercarse a la media. Lo mismo puede decirse de los padres bajos. 
   Hoy en día el sentido de regresión es el de predicción de una medida basándose en el conocimiento de otra 

2. ESTUDIO CONJUNTO DE DOS VARIABLES 
  A la derecha tenemos una posible manera de recoger los datos obtenidos observando dos variables en varios individuos de una muestra. 
  En cada fila tenemos los datos del individuo 
  Cada columna representa los valores que toma una variable sobre los mismos 
  Los individuos no se muestran en ningún orden particular 
  Dichas observaciones pueden ser representadas en un diagrama de dispersión (“scatterplot”). En ellos, cada individuo es un punto cuyas coordenadas son los valores de las variables
  Nuestro objetivo será intentar reconocer a partir del mismo si hay relación entre las variables, de que tipo, y si es posible

3. DIAGRAMAS DE DISPERSIÓN O NUBE DE PUNTOS 
Tenemos las alturas y los pesos de 30 individuos representados de un diagrama de dispersión. 



RELACIÓN ENTRE VARIABLES
Tenemos las alturas y los pesos de 30 individuos representados de un diagrama de dispersión. 



PREDICCIÓN DE UNA VARIABLE EN FUNCIÓN DE OTRA
Aparentemente el peso aumenta 10kg por cada 10 cm de altura... o sea, el peso aumenta en una unidad de altura 


RELACIÓN DIRECTA E INVERSA

MODELOS DE ANÁLISIS DE REGRESIÓN

En clase solo tratamos el modelo de regresión lineal simple 

REGRESIÓN LINEAL SIMPLE: CORRELACIÓN Y DETERMINACIÓN
·       Se trata de estudiar la asociación lineal entre dos variables cuantitativas
·       Ejemplo: influencia de la edad en las cifras de Tensión arterial Sistólica
·       Regresión lineal simple: una sola variable independiente
·       Regresión lineal múltiple: más de una variable independiente
·       Ecuación de la recta: y = ax + b (ej: TAS=a· edad +b)
·       Pendiente de la recta a = β1
·       Punto de intersección con el eje de coordenadas b=β0
·       Pendiente de la recta a = β1
·       Punto de intersección con el eje de coordenadas b=β0
·       Β1 expresa la cantidad de cambio que se produce en la variable dependiente por unidad de cambio de la variable independiente
·       Β0 expresa cuál es el valor de la variable dependiente cuando la independiente vale cero
·       Modelos lineales deterministas: la variable independiente determine el valor de la variable dependiente. Entonces para cada valor de la variable independiente sólo habría un valor de la dependiente
·       Modelos lineales probabilísticos: Para cada valor de la variable independiente existe una distribución de probabilidad de valores de la dependiente, con una probabilidad entre 0 y 1.
·       La recta a determinar es aquélla con la menor distancia de cada punto a ella.




·       Y = β1 · x + β0
·       Yi= β1 · x + β0 + ei
·       Y sería la media de la variable dependiente en un grupo con el mismo valor de la variable independiente Yi= y + ei
·       Para construir un modelo de regresión lineal hace falta conocer: Punto de intersección con el eje de coordenadas=β0 y la Pendiente de la recta a = β1
·       No hay un modelo determinista: hay una nube de puntos y buscamos la recta que mejor explica el comportamiento de la variable dependiente en función de la variable independiente

 Teniendo una nube de puntos, ¿cómo elegir la recta que mejor se ajuste a esos puntos?: Mediante el método de los mínimos cuadrados.
Se trata de la recta que hace mínimo el cuadrado de la suma de las distancias verticales desde ella hasta cada uno de los puntos de la nube
(CÓMO CALCULAR B0 Y B1 EN PROBLEMAS.)
·       Coeficiente de correlación (Pearson y Spearman): Número adimensional (entre -1 y 1) que mide la fuerza y el sentido de la relación lineal entre dos variables.
·       r= β1 • sx /sy
·       Coeficiente de determinación: número adimensional (entre 0 y 1) que dá idea de la relación entre las variables relacionadas linealmente. Es r2



Hasta aquí el tema 12. ¡Espero que os sea de gran ayuda!😊😊

Comentarios

Entradas populares de este blog

Tema 6. REPRESENTACIÓN GRÁFICA DE LA INFORMACIÓN Representación de variables cualitativas y cuantitativas discretas. Representación de variables cuantitativas continuas. Errores en las representaciones

Tema 5. Estadísticos univariables: medidas resumen para variables cuantitativas: medidas de tendencia central. medidas de dispersión. Medidas de posición. Forma de distribución: asimetría y curtosis

Tema 4. Introducción a la estadística descriptiva