Estadística Inferencial

  1. Generación de Muestras Aleatorias Simples

  2. Tests Paramétricos

    1. Test para la media poblacional con varianza desconocida
    2. Test para la igualdad de medias con igual varianza
    3. Test para la igualdad de medias para datos apareados
    4. Test para la igualdad de varianzas.
  3. La prueba chi cuadrado. Tablas de contingencia

  4. Regresión

  5. Bibliografía

Página creada por Juan Carlos Falcón y de libre disposición


Generación de Muestras Aleatorias Simples

    Si tenemos una variable aleatoria x cuya función de distribución es F(x), podemos generar una muestra artificial aleatoria simple mediante números randómicos de una distribución uniforme 0,1 calculando sobre cada elemento de la muestra el inverso de la función de distribución F(x).

Referencia Excel: en el ejemplo usamos la función ALEATORIO() y algunas funciones que devuelven las inversas de distribuciones bien conocidas.

Tests paramétricos

    Usaremos los siguientes resultados para los tests

Los valores críticos +t, -t deja la zona sombreada con valor alfa
El valor crítico de t deja la zona sombreada con valor alfa
El valor crítico de t deja la zona sombreada con valor alfa

Las siguientes fórmulas son comunes en todos los ejemplos

Referencia EXCEL: Fórmulas usadas
PROMEDIO(rango) Calcula la media poblacional
DESVESTP(rango) Calcula la desviación estándar poblacional
DESVEST(rango) Calcula la raíz de la cuasivarianza.
DISTR.T.INV(prob;g.l.) Devuelve +t siendo el área a la izquierda de -t y a la derecha de +t juntos igual a prob en una t de g.l. grados de libertad.
Test para la media poblacional con varianza desconocida

    El estadístico siguiente es una distribución t con (n-1)g.l.

Ejemplos:

Test para la igualdad de medias con igual varianza

     Para la comparación de medias de dos poblaciones normales con igual varianza atenderemos al siguiente estadístico cumpliendo la distribución especificada:

     En el caso de existir dudas sobre la igualdad de varianza se establecerá un test F para la igualdad de varianzas respaldado por el siguiente resultado para dos poblaciones normales:

Ejemplos:

Test para la igualdad de medias para datos apareados

     Usaremos para este tipo el siguiente resultado para datos normales de muestras que provienen de los mismos individuos. Las variables aleatorias no han de cumplir independencia.

Ejemplos:

Test para la igualdad de varianzas.

     Usaremos test de este tipo cuando necesitemos comparar las varianzas de dos poblaciones normales. Nos basamos en el siguiente resultado

Los siguientes tests de hipótesis habituales:

Los valores críticos f,1/f deja la zona sombreada con valor alfa
El valor crítico de f deja la zona sombreada con valor alfa
El valor crítico de f deja la zona sombreada con valor alfa

Ejemplos:

La prueba chi cuadrado. Tablas de contingencia

     Los siguientes tests se basan en el siguiente resultado

Las siguientes fórmulas son comunes en todos los ejemplos

Referencia EXCEL: Fórmulas usadas
PRUEBA.CHI(rangoA;rangoB) Realiza el test anterior con los grados de libertad adecuados entre las frecuencias observadas (rangoA) y las esperadas (rangoB). Los rangos en este caso tiene que estar en forma vectorial. Los rangos en forma de tabla responden a tablas de contingencia. Devuelve el p valor de la prueba.
PRUEBA.CHI.INV(prob;g.l.) Devuelve el valor que deja a la derecha la probabilidad prob en una distribución Chi cuadrado de g.l. grados de libertad.

Ejemplos:

Tablas de contingencia

    Usaremos el test chi cuadrado para estudiar la dependencia de sucesos en una población. Partimos de las siguientes hipótesis:

    Sea una población que admite las siguientes descomposiciones:

de manera que

    Bajo la hipótesis de independencia estocástica de Ai y Bj podemos afirmar lo siguiente

    En esta situación realizamos n pruebas independientes cumpliendo

Observadas B1 Bl Subtotales
A1
Ak
Subtotales

Esperadas B1 Bl Subtotales
A1
Ak
Subtotales

    Bajo estas condiciones, el estadístico cumple

Referencia Excel:

    Para hacer referencia en la hoja de cálculo a las celdas usamos habitualmente notación columna fila donde la columna se nombra a partir del abecedario (A,B,C,...) y las filas a partir de números (1,2,...). cuando en una celda aparece una fórmula con un rango determinado, al copiarla y pegarla automáticamente el rango es trasladado tantas posiciones en filas y columnas como la diferencia de filas y columnas entre la celda original y la celda donde se pega la fórmula. Se dice que las celdas están referenciadas de manera relativa.

    En ocasiones este movimiento no es deseable, al menos en parte. Esto es lo que ocurre para la construcción de la tabla de frecuencias esperadas. Si queremos que el pegado de las fórmulas respete el rango original usaremos referencias absolutas en las celdas, notando que se tiene la capacidad de fijar filas o columnas de manera independiente, es decir, podemos forzar que el desplazamiento de celdas ocurra solo en columnas, solo en filas o en ninguna de las dos. La manera de establecer la referencia absoluta es anteponer el signo $ antes del nombre de columna o fila de una celda. Tal y como se puede visualizar en los ejemplos, para el cálculo de la primera frecuencia esperada, f1.xf.1 multiplico los dos subtotales y referencio como absolutas la fila (numero) del primero, la columna (letra) del segundo y la fila y columna del total. En el ejemplo 85 dicha frecuencia queda así: =D$12*$H9/$H$12. Luego solo queda arrastrar la fórmula, una vez introducida, primero hacia la derecha y después hacia abajo (o al revés). De esta forma la tabla de frecuencias esperadas queda rápidamente confeccionada.

    Para el cálculo del p valor de la tabla de contingencia usaremos la función PRUEBA.CHI(rangoA;rangoB) donde rangoA son las frecuencias observadas y rangoB las frecuencias esperadas. No es necesario indicar los grados de libertad, pero los datos tienen que venir en forma de tabla.

OBS: es recomendable señalar el rango marcando la tabla con bordes para no confundirnos.

Fórmulas usadas
SUMA(rango) Suma todos los elementos incluidos en rango

Ejemplos:

Regresión

    El propósito de la regresión lineal es el de establecer pronósticos de medidas cercanas a la media de los datos independientes (valores x) que modelan la media de una población normal y se comportan de una manera más o menos lineal de manera local. Algo parecido al comportamiento de la derivada en un punto. Para que la regresión sea efectiva tiene que cumplir cuatro hipótesis iniciales:

Para i=1,...n tenemos yi =b0+b1 xi1+...+bk xik+ ui
n observaciones de y n de xj para j=1,...,k
u una perturbación estocástica. Todo ello bajo las hipótesis siguientes.

  1. La perturbación tiene esperanza nula: E[ui] =0
  2. La varianza de la perturbación es siempre constante: Var(ui)=cte
  3. La perturbación ui tiene distribución normal
  4. Las perturbaciones son independientes entre sí. E(ui uj) =0

    De este modo se trata de establecer estimadores tanto para los factores bj como para la desviación sigma de las perturbaciones. Para ello se usan estimadores mínimo cuadráticos.

    No entraremos en detalles acerca de cómo se construyen los estimadores. Nos centraremos en los recursos de que la hoja EXCEL dispone.

Referencia EXCEL

     La función usada para estimar los parámetros par la regresión lineal es ESTIMACION.LINEAL(rangoA;rangoB;lógico1;lógico2). Es una función que devuelve un conjunto de valores, esto es, una función matricial. Para poder incrustar los resultados de una fórmula matricial en una hoja hay que seguir religiosamente los siguientes pasos:

  1. Seleccionar una celda e insertar la función ESTIMACION.LINEAL(rangoA;rangoB;lógico1;lógico2). RangoA es la variable y dependiente. RangoB el conjunto (tabla) de valores independientes. LógicoA nos asegura el uso de término independiente en caso verdadero u omitido en caso falso. LógicoB da parámetros adicionales de la regresión si verdadero y sólo los factores para la fórmula lineal si falso.
  2. Una vez seleccionada la función sólo se visualizará en la celda uno de los valores que se devuelve. Para ver el resto seleccionamos el rango de celdas que suponemos va a ocupar el conjunto de resultados.
  3. Seguidamente seleccionamos en negrita el visualizador de contenidos de celdas de la barra de herramientas (donde aparece la fórmula).
  4. Una vez seleccionado pulsamos Ctrl+Mayús+Enter. Si hemos pulsado bien la fórmula ESTIMACION.LINEAL(rangoA;rangoB;lógico1;lógico2) aparece entre llaves (={ESTIMACION.LINEAL(rangoA;rangoB;lógico1;lógico2).}) y el resto de resultados aparecerá en la hoja.

     Una vez seleccionado el rango matricial de valores devueltos es MUY RECOMENDABLE no manipularlo, pues no soporta alteración de celdas individuales y de manera impertinente lanza errores que nos obligan a abortar el proceso de la aplicación, perdiendo los datos hasta ahora introducidos en la hoja. Se recomienda proteger las celdas.

     También es recomendable leer la ayuda EXCEL buscando por estimación, pues es bastante completa (lo mismo para el resto de funciones).

Ejemplos:


Bibliografía

Volver a la Página Principal