Estadistica inferencial:
Es aquella que estudia los meodos mediante los cuales se obtienen generalizaciones o se toman desiciones con base a una informacion parcial o incompleta obtenida mediante tecnicas descriptivas.
Es aquella que estudia los meodos mediante los cuales se obtienen generalizaciones o se toman desiciones con base a una informacion parcial o incompleta obtenida mediante tecnicas descriptivas.
Curva de distribcion normal.
Caracteristicas:
- Es simetrica especto al eje "y" es decir, el área bajo la curva es la misma de cero a+∞ que de cero a-∞.
- Es concava hacia abajo entre x= -1 y x= 1 cóncava hacia arria en el resto de la curva.
- Asintótica con respectto al ejej de las "x" en ambos sentidos es decir, se extiende en ambas direcciones hasta el infinito sin toca nunca e eje de las abscisas.
- Para x=o "y" tiene su valor maximo que es aproximadamente 0.4.
- Las probabilidades de variables aleatorias siempre seran para un intervalo de valores.
- El area bajo la curva entre la media y cualquier otro punto está en funcion del número de desviaiones estándar que el punto diste de la media.
Areas bajo la curva.
E hablar de una curva normal estandar N (0,1) significa la curva nomal con media µ=0 y desviacion estadar σ=1.
E hablar de una curva normal estandar N (0,1) significa la curva nomal con media µ=0 y desviacion estadar σ=1.
La probabilidad designada al intervalo comprrendido entre a y b sobre el eje x, es el area comprendida entre a, b y la curva normal standar (grafica f).
EJEMPLO 1:
Obtenga la proporcion de área bajo la curva que existe entre la media µ=0 y Z=1.
Solucion:
Observando la tabla de valores, en la primera columna para; Z=1 el área bajo la curva normal standar entre µ=0 y Z=1 es igual a 0.3413 que graficamente se representa en la grafica (g).
El área bajo la curva igual a 0.3413 tambien se puede expresar como el 34.13% del área total que es el 100%.
Tambien se puede decir que la probabilidad de que un evento se localice entre el cero y uno es igual a 0.3413.
Notése que al hablar del área bajo la curva sse esta hablando tambien de una pobabilidad.
Area bajo la curva = probabilidad.
El áreabajo la curva entre 0 y -1 por simetria de la curva nomal standar, es igual a 0.3413.
Diseño de hipótesis..
Suponga que se tiene interés en la rapidez de combustión de un agente propulsor sólido utilizado en los sistemas de salida de emergencia para la tripulación de aeronaves. El interés se centra sobre la rapidez de combustión promedio. De manera específica, el interés recae en decir si la rapidez de combustión promedio es o no 50 cm/s. Esto puede expresarse de manera formal como
Ho;
= 50 cm/s

H1;
50 cm/s


La proposición Ho;
= 50 cm/s, se conoce como hipótesis nula, mientras que la proposición H1;
50 cm/s, recibe el nombre de hipótesis alternativa. Puesto que la hipótesis alternativa especifica valores de
que pueden ser mayores o menores que 50 cm/s, también se conoce como hipótesis alternativa bilateral. En algunas situaciones, lo que se desea es formular una hipótesis alternativa unilateral, como en




Ho;
= 50 cm/s Ho;
= 50 cm/s


ó
H1;
< 50 cm/s H1;
> 50 cm/s
Es importante recordar que las hipótesis siempre son proposiciones
sobre la población o distribución bajo estudio, no proposiciones sobre
la muestra. Por lo general, el valor del parámetro de la población
especificado en la hipótesis nula se determina en una de tres maneras
diferentes:

- Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces el objetivo de la prueba de hipótesis usualmente es determinar si ha cambiado el valor del parámetro.
- Puede obtenerse a partir de alguna teoría o modelo que se relaciona con el proceso bajo estudio. En este caso, el objetivo de la prueba de hipótesis es verificar la teoría o modelo.
- Cuando el valor del parámetro proviene de consideraciones externas, tales como las especificaciones de diseño o ingeniería, o de obligaciones contractuales. En esta situación, el objetivo usual de la prueba de hipótesis es probar el cumplimiento de las especificaciones.
La hipótesis nula, representada por Ho, es la afirmación sobre una o más características de poblaciones que al inicio se supone cierta (es decir, la "creencia a priori").
La hipótesis alternativa, representada por H1, es la afirmación contradictoria a Ho, y ésta es la hipótesis del investigador.
La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la evidencia muestral sugiere que Ho es falsa. Si la muestra no contradice decididamente a Ho, se continúa creyendo en la validez de la hipótesis nula. Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis son rechazar Ho o no rechazar Ho.
Prueba de una Hipótesis Estadística
Para ilustrar los conceptos generales, considere el problema de la
rapidez de combustión del agente propulsor presentado con anterioridad.
La hipótesis nula es que la rapidez promedio de combustión es 50 cm/s,
mientras que la hipótesis alternativa es que ésta no es igual a 50 cm/s.
Esto es, se desea probar:
Ho;
= 50 cm/s

H1;
50 cm/s


Supóngase que se realiza una prueba sobre
una muestra de 10 especímenes, y que se observa cual es la rapidez de
combustión promedio muestral. La media muestral es un estimador de la
media verdadera de la población. Un valor de la media muestral
que este próximo al valor hipotético
= 50 cm/s es una evidencia de que el verdadero valor de la media
es realmente 50 cm/s; esto es, tal evidencia apoya la hipótesis nula Ho. Por otra parte, una media muestral muy diferente de 50 cm/s constituye una evidencia que apoya la hipótesis alternativa H1. Por tanto, en este caso, la media muestral es el estadístico de prueba.



La media muestral puede tomar muchos valores diferentes. Supóngase que si 48.5

51.5, entonces no se rechaza la hipótesis nula Ho;
= 50 cm/s, y que si
<48.5 ó
>51.5, entonces se acepta la hipótesis alternativa H1;
50 cm/s.








Los valores de
que son menores que 48.5 o mayores que 51.5 constituyen la región crítica de la prueba, mientras que todos los valores que están en el intervalo 48.5

51.5 forman la región de aceptación. Las fronteras entre las regiones crítica y de aceptación reciben el nombre de valores críticos. La costumbre es establecer conclusiones con respecto a la hipótesis nula Ho. Por tanto, se rechaza Ho en favor de H1 si el estadístico de prueba cae en la región crítica, de lo contrario, no se rechaza Ho.
Este procedimiento de decisión puede conducir a una de dos
conclusiones erróneas. Por ejemplo, es posible que el valor verdadero de
la rapidez promedio de combustión del agente propulsor sea igual a 50
cm/s. Sin embargo, para todos los especímenes bajo prueba, bien puede
observarse un valor del estadístico de prueba 




El error tipo I se define como el rechazo de la hipótesis nula Ho cuando ésta es verdadera. También es conocido como
ó nivel de significancia.
Si tuviéramos un nivel de confianza del 95% entonces el nivel de
significancia sería del 5%. Análogamente si se tiene un nivel de
confianza del 90% entonces el nivel de significancia sería del 10%.
Ahora supóngase que la verdadera rapidez promedio de combustión es diferente de 50 cm/s, aunque la media muestral

El error tipo II ó error

Por tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones diferentes que determinan si la decisión final es correcta o errónea.
Decisión
|
Ho es verdadera
|
Ho es falsa
|
Aceptar Ho
|
No hay error
|
Error tipo II ó
![]() |
Rechazar Ho
|
Error tipo I ó
![]() |
No hay error
|
- Los errores tipo I y tipo II están relacionados. Una disminución en la probabilidad de uno por lo general tiene como resultado un aumento en la probabilidad del otro.
- El tamaño de la región crítica, y por tanto la probabilidad de cometer un error tipo I, siempre se puede reducir al ajustar el o los valores críticos.
- Un aumento en el tamaño muestral n reducirá
y
de forma simultánea.
- Si la hipótesis nula es falsa,
es un máximo cuando el valor real del parámetro se aproxima al hipotético. Entre más grande sea la distancia entre el valor real y el valor hipotético, será menor
.
Se pueden presentar tres tipos de ensayo de hipótesis que son:
- Unilateral Derecho
- Unilateral Izquierdo
- Bilateral
Dependiendo de la evaluación que se quiera hacer se seleccionará el tipo de ensayo.
- Unilateral Derecho. El investigador desea comprobar la hipótesis de un aumento en el parámetro, en este caso el nivel de significancia se carga todo hacia el lado derecho, para definir las regiones de aceptación y de rechazo.
Ho; Parámetro

H1; Parámetro >
x 

- Unilateral Izquierdo: El investigador desea comprobar la hipótesis de una disminución en el parámetro, en este caso el nivel de significancia se carga todo hacia el lado izquierdo, para definir las regiones de aceptación y de rechazo.
Ho; Parámetro

H1; Parámetro < x

- Bilateral: El investigador desea comprobar la hipótesis de un cambio en el parámetro. El nivel de significancia se divide en dos y existen dos regiones de rechazo.
Ho; Parámetro = x
H1; Parámetro


Ejemplos:
- Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado muestra una vida promedio de 71.8 años. Suponga una desviación estándar poblacional de 8.9 años, ¿esto parece indicar que la vida media hoy en día es mayor que 70 años? Utilice un nivel de significancia de 0.05.
- Se trata de una distribución muestral de medias con desviación estándar conocida.
- Datos:



n = 100

- Ensayo de hipótesis Ho;
- Regla de decisión: Si zR
- Cálculos:
- Justificación y decisión.

H1;



Si zR> 1.645 se rechaza Ho.

Nivel de confianza
El nivel de confianza es la probabilidad de que el parámetro a estimar se encuentre en el intervalo de confianza.
El nivel de confianza (p) se designa mediante 1 − α, y se suele tomar en tanto por ciento.
Los niveles de confianza más usuales son: 90%; 95% y 99%.
El nivel de significación se designa mediante α.
El valor crítico (k) como z α/2 .
P(Z>z α/2) = α/2 P[-z α/2 < z < z α/2] = 1 - α
1 - α | α/2 | z α/2 |
---|---|---|
0.90 | 0.05 | 1.645 |
0.95 | 0.025 | 1.96 |
0.99 | 0.005 | 2.575 |
En una distribución N(μ, σ ) el intervalo característico correspondiente a una probabilidad p = 1 - α es:
(μ - z α/2 · σ, μ + z α/2 · σ )
Ejercicio
La media de las estaturas de una muestra aleatoria de 400
personas de una ciudad es 1,75 m. Se sabe que la estatura de las
personas de esa ciudad es una variable aleatoria que sigue una
distribución normal con varianza σ2 = 0,16 m2.
Construye un intervalo, de un 95% de confianza, para la media de las estaturas de la población.
n = 400 x = 1.75 σ = 0.4
1- α = 0.95 z α/2 = 1.96
(1.75 ± 1.96 · 0.4/20 ) → (1.7108,1.7892)
No hay comentarios:
Publicar un comentario