lunes, 11 de octubre de 2010

TAREA ASIGNADA A PARTICIPANTES

INVESTIGAR PARA EL JUEVES 14/10/10

.- Coeficiente de Correlaciòn de Pearson
.- Regresiòn Lineal
.- Correlaciòn

-Trabajo Individual.Para redactar un trabajo escrito es de suma importancia realizar investigación del tema que se pretende abordar. Recordando que lo que se va a escribir no es una reproducción exacta de lo leído, sino una interpretación o una paráfrasis de lo que se leyó.
- Trabajo de calidad, redactado con claridad para expresar lo que se quiere decir, debe utilizar palabras que sean comprensibles para el lector, por ello es necesario recordar que no se escribe como se habla, por lo que es indispensable cuidar la forma gramatical y la ortografía.
-La entrega del trabajo será justificado para que todas las líneas midan lo mismo y así darle un sentido de orden y estética al trabajo.

REGRESION MULTIPLE EJERCICIO PROPUESTO

1. (Enero 2000) Se quiere analizar como se puede predecir la grasa corporal en funcion de la grasa en el triceps, muslo y brazo mediante una regresion y para ello, se tomaron n=200 muestras. Las variables son, por tanto, las siguientes:
BODYFAT: Grasa Corporal
TRICEPS: Grasa en el Triceps
THIGH: Grasa en el Muslo
ARM: Grasa en el Brazo
(a) Se han ajustado los siguientes modelos de regresion en los que la variable
respuesta es BODYFAT y entre parentesis figuran los errores estandar.
M1 M2 M3 M4 M5 M6 M7
TRICEPS 4.33 0.22 1.00 0.86
(3.01) (0.30) (0.12) (0.13)
THIGH -2.85 0.66 0.85 0.86
(2.58) (0.29) (0.11) (0.11)
ARM -2.18 0.10 -0.43 -0.20
(1.59) (0.16) (0.17) (0.06)
R2 80.14 77.80 77.57 78.61 71.10 77.10 50.21

Indicar si las variables TRICEPS, THIGH y ARM son significativas en los
modelos M1, ...,M7.
(b) A la vista de los resultados ¿qu´e puede concluirse? Justificar la respuesta.
(c) ¿Que modelo de regresion podrıa elegirse? ¿por que?

EJERCICIO REGRESION PROPUESTO

1. Los resultados de hacer una regresión entre el peso y la altura de 117 estudiantes de
ingeniería se muestran a continuación:
Regression Analysis - Linear model: Y = a + b*X
Dependent variable: peso
Independent variable: altura
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
Intercept -100,223 13,1854 -7,60105 0,0000
Slope 0,965607 0,0750716 12,8625 0,0000
-----------------------------------------------------------------------------
a) Indicar si la altura es significativa al 95%.
b) Calcular un intervalo de confianza para la pendiente.
c) Calcular el peso esperado de una persona de 180 cm.

REGRESIÔN MULTIPLE

Se define como un procedimientomediante el cual se trata de determinar si existe o no relación de dependencia entre dos o más variables. Es decir, conociendo los valoresde una variable independiente, se trata de estimar los valores, de una o más variables dependientes.

La regresión en forma grafica, trata de lograr que una dispersión de las frecuencias sea ajustada a una línea recta o curva.

Clases de Regresión

La regresión puede ser Lineal y Curvilínea o no lineal, ambos tipos de regresión pueden ser a su vez:

Esta regresión se utiliza con mayor frecuencia en las cienciaseconómicas, y sus disciplinas tecnológicas. Cualquier función no lineal, es linealizada para su estudio y efectos prácticos en las ciencias económicas, modelos no lineales y lineales multiecuacionales.

Objetivo: Se utiliza la regresión lineal simple para:

1.- Determinar la relación de dependencia que tiene una variable respecto a otra.

2.- Ajustar la distribución de frecuencias de una línea, es decir, determinar la forma de la línea de regresión.

3.- Predecir un dato desconocido de una variable partiendo de los datos conocidos de otra variable.

Por ejemplo: Podría ser una regresión de tipo lineal:

En una empresa de servicio de Internetbusca relacionar las ganancias que obtiene cada computadora con el numero de usuarios que ingresan a dicha cabina diariamente. En la tabla representa Y (Ganancias S/.) e X (Numero de usuarios)


Y
100
98
99
102
102
111
97
104
102
96

X
116
96
110
105
99
106
100
109
98
108

Coeficiente de Regresión

Indica el número de unidades en que se modifica la variable dependiente "Y" por efecto del cambio de la variable independiente "X" o viceversa en una unidad de medida.

Clases de coeficiente de Regresión:

El coeficiente de regresión puede ser: Positivo, Negativo y Nulo.

Es positivo cuando las variaciones de la variable independiente X son directamente proporcionales a las variaciones de la variable dependiente "Y"

Es negativo, cuando las variaciones de la variable independiente "X" son inversamente proporcionales a las variaciones de las variables dependientes "Y"

Es nulo o cero, cuando entre las variables dependientes "Y" e independientes "X" no existen relación alguna.

REGRESIÓN SIMPLE Y CORRELACIÓN

La Regresión y la correlación son dos técnicas estadísticas que se pueden utilizar para solucionar problemas comunes en los negocios.

Muchos estudios se basan en la creencia de que es posible identificar y cuantificar alguna Relación Funcional entre dos o más variables, donde una variable depende de la otra variable.

Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera en un modelo de Regresión Simple.

"Y es una función de X"

Y = f(X)

Como Y depende de X,

Y es la variable dependiente, y

X es la variable independiente.

En el Modelo de Regresión es muy importante identificar cuál es la variable dependiente y cuál es la variable independiente.

En el Modelo de Regresión Simplese establece que Y es una función de sólo una variable independiente, razón por la cual se le denomina también Regresión Divariada porque sólo hay dos variables, una dependiente y otra independiente y se representa así:

Y = f (X)

"Y está regresando por X"

La variable dependiente es la variable que se desea explicar, predecir. También se le llama REGRESANDO ó VARIABLE DE RESPUESTA.

La variable Independiente X se le denomina VARIABLE EXPLICATIVA ó REGRESOR y se le utiliza para EXPLICAR Y.

ANÁLISIS ESTADÍSTICO: REGRESIÓN LINEAL SIMPLE

En el estudio de la relación funcional entre dos variables poblacionales, una variable X, llamada independiente, explicativa o de predicción y una variable Y, llamada dependiente o variable respuesta, presenta la siguiente notación:

Y = a + b X + e

Donde:

a es el valor de la ordenada donde la línea de regresión se intercepta con el eje Y.

b es el coeficiente de regresión poblacional (pendiente de la línea recta)

e es el error

SUPOSICIONES DE LA REGRESIÓN LINEAL

1.Los valores de la variable independiente X son fijos, medidos sin error.
2.La variable Y es aleatoria
3.Para cada valor de X, existe una distribución normal de valores de Y (subpoblaciones Y)
4.Las variancias de las subpoblaciones Y son todas iguales.
5.Todas las medias de las subpoblaciones de Y están sobre la recta.
6.Los valores de Y están normalmente distribuidos y son estadísticamente independientes.
ESTIMACIÓN DE LA ECUACIÓN DE REGRESIÓN MUESTRAL

Consiste en determinar los valores de "a" y "b " a partir de la muestra, es decir, encontrar los valores de a y b con los datos observados de la muestra. El método de estimación es el de Mínimos Cuadrados, mediante el cual se obtiene:




Luego, la ecuación de regresión muestral estimada es



Que se interpreta como:

a es el estimador de a

Es el valor estimado de la variable Y cuando la variable X = 0

b es el estimador de b , es el coeficiente de regresión

Está expresado en las mismas unidades de Y por cada unidad de X. Indica el número de unidades en que varía Y cuando se produce un cambio, en una unidad, en X (pendiente de la recta de regresión).

Un valor negativo de b sería interpretado como la magnitud del decremento en Y por cada unidad de aumento en X.

Los datos de la siguiente tabla representan las estaturas (X, cm) y los pesos (Y, kg) de una muestra de 12 hombres adultos. Para cada estatura fijada previamente se observó el peso de una persona seleccionada de entre el grupo con dicha estatura, resultando:


X
152
155
152
155
157
152
157
165
162
178
183
178

Y
50
61.5
54.5
57.5
63.5
59
61
72
66
72
84
82


Con estos datos vamos a plantear una ecuación de regresión simple que nos permita pronosticar los pesos conociendo las tallas. Utilizaremos a = 0.05, y contrastaremos nuestra hipótesis con la prueba F.

REGRESIÒN LINEAL

En estadística la regresión lineal o ajuste lineal es un método matemático que modeliza la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε. Este modelo puede ser expresado como:


donde β0 es la intersección o término "constante", las son los parámetros respectivos a cada variable independiente, y p es el número de parámetros independientes a tener en cuenta en la regresión. La regresión lineal puede ser contrastada con la regresión no lineal.

El modelo de regresión lineal
El modelo lineal relaciona la variable dependiente Y con K variables explicativas Xk (k = 1,...K), o cualquier transformación de éstas, que generan un hiperplano de parámetros βk desconocidos.


donde es la perturbación aleatoria que recoge todos aquellos factores de la realidad no controlables u observables y que por tanto se asocian con el azar, y es la que confiere al modelo su carácter estocástico. En el caso más sencillo de dos variables explicativas, el hiperplano es una recta.


El problema de la regresión consiste en elegir unos valores determinados para los parámetros desconocidos βk, de modo que la ecuación quede completamente especificada. Para ello se necesita un conjunto de observaciones. En una observación cualquiera i-ésima (i= 1,... I) se registra el comportamiento simultáneo de la variable dependiente y las variables explicativas (las perturbaciones aleatorias se suponen no observables).


Los valores escogidos como estimadores de los parámetros, , son los coeficientes de regresión, sin que se pueda garantizar que coinciden con parámetros reales del proceso generador.


Los valores son por su parte estimaciones de la perturbación aleatoria o errores.