TEMARIO
3.1 Introducción.
3.2 Variables aleatorias discretas.
3.3 Variables aleatorias continuas.
3.4 Métodos para generar variables aleatorias.
3.5 Procedimientos especiales.
3.2 Variables aleatorias discretas.
3.3 Variables aleatorias continuas.
3.4 Métodos para generar variables aleatorias.
3.5 Procedimientos especiales.
Método Conguencial Mixto
Este
genera una sucesión de números enteros aleatorios en el cual el proximo número
pseudoaleatorio, es determinado a partir del último número generado, es decir,
el número pseudoaleatorio Xn+1, es derivado a partir del numero pseudoaleatorio
Xn. Para en caso particular del generador congruencial mixto, la relación de
recurrencia es la siguiente: Xn+1 = (aXn + c) mod m, donde:
- Xo = la semilla (Xo > 0)
- a = el multiplicador (a > 0)
- c = constante aditiva (c > 0)
- m = modulo (m > Xo, m > 0 y m > c )
a = 5, c
= 7, Xo = 4, m = 8
n
|
Xn
|
(5Xn + 7)/8
|
Xn+1
|
Números uniformes
|
0
|
4
|
27/8
|
3
|
3/8
|
1
|
3
|
22/8
|
6
|
6/8
|
2
|
6
|
37/8
|
5
|
5/8
|
3
|
5
|
32/8
|
0
|
0/8
|
4
|
0
|
7/8
|
7
|
7/8
|
5
|
7
|
42/8
|
2
|
2/8
|
6
|
2
|
17/8
|
1
|
1/8
|
7
|
1
|
12/8
|
4
|
4/8
|
8
|
4
|
-
|
-
|
-
|
a = 7, c
= 7, Xo = 7, m =10
n
|
Xn
|
(5Xn + 7)/8
|
Xn+1
|
Números uniformes
|
0
|
7
|
56/10
|
6
|
6/10
|
1
|
6
|
49/10
|
9
|
9/10
|
2
|
9
|
70/10
|
0
|
0/10
|
3
|
0
|
7/10
|
7
|
7/10
|
4
|
7
|
-
|
-
|
-
|
a = 8, c
= 16, Xo = 15, m =100
n
|
Xn
|
(5Xn + 7)/8
|
Xn+1
|
Números uniformes
|
0
|
15
|
136/100
|
36
|
36/100
|
1
|
36
|
304/100
|
4
|
4/100
|
2
|
4
|
48/10
|
48
|
48/100
|
3
|
48
|
400/100
|
0
|
0/100
|
4
|
0
|
16/100
|
16
|
16/100
|
5
|
16
|
144/100
|
44
|
44/100
|
6
|
44
|
368/100
|
68
|
68/100
|
7
|
68
|
560/100
|
60
|
60/100
|
8
|
60
|
496/100
|
96
|
96/100
|
9
|
96
|
784/100
|
84
|
84/100
|
10
|
84
|
688/100
|
88
|
88/100
|
11
|
88
|
720/100
|
20
|
20/100
|
12
|
20
|
176/100
|
76
|
76/100
|
13
|
76
|
624/100
|
24
|
24/100
|
14
|
24
|
208/100
|
8
|
8/100
|
15
|
8
|
80/100
|
80
|
80/100
|
16
|
80
|
656/100
|
56
|
56/100
|
17
|
56
|
464/100
|
64
|
64/100
|
18
|
64
|
528/100
|
28
|
28/100
|
19
|
28
|
240/100
|
40
|
40/100
|
20
|
40
|
336/100
|
36
|
36/100
|
21
|
36
|
304/100
|
4
|
-
|
Medios al
cuadrado
Este
algoritmo no congruencial requiere un numero entero denotador (llamado semilla)
con D digitos, el cual es elevado al cuadrado para seleccionar del resultado
los D digitos del centro; el primer numero ri se determina simplemente
anteponiendo el cero a esos digitos.
Para
obtener el segundo r se sigue el mismo procedimiento, solo que ahora se eleva
al cuadrado los d digitos del centro que se seleccionaron para obtener el
primer r. Este método se repite hasta obtener n números r.
Pasos:
- Seleccionar una semilla (Xo) con d digitos (D > 3).
- Sea X0 = resultado de elevar Xo al cuadrado; sea X1 digitos del centro, y sea ri = 0, d digitos del centro.
- Sea yi = resultado de elevar Xi al cuadrado; sea Xi+1 = a los dígitos del centro, y sea ri = 0, d dígitos del centro para toda i = 1, 2, 3, …n.
- Repetir el paso tres hasta obtener los n números ri deseados.
NOTA: si
no es posible obtener los D dígitos del centro del numero yi, agregue ceros a
la izquierda del numero yi.
Generar
los primeros 14 números a partir de 3825, con 4 digitos.
Número
|
Resultado
|
3825^2
|
14630625
|
6306^2
|
39765636
|
7656^2
|
58614336
|
6143^2
|
37736449
|
7364^2
|
54228496
|
2284^2
|
05216656
|
2166^2
|
04691556
|
6915^2
|
47817225
|
8172^2
|
66781584
|
7815^2
|
61074225
|
0742^2
|
00550564
|
5504^2
|
30305025
|
3050^2
|
09302500
|
3025^2
|
09150625
|
MÉTODO
MULTIPLICATIVO
Para este
generador se recomienda una selección adecuada para los valores de los
parámetros a, Xo y m; con el fin de asegurar un periodo máximo para las
sucesiones generadas por este método:
Número
Decimal (sistema); los valores de los parámetros deben ser seleccionadas de
acuerdo a los siguientes criterios:
- El valor de la semilla puede ser cualquiera entero impar no divisible entre 2 o 5.
- Debe ser relativamente primo a “m”.
- El valor seleccionado de “a”, debe ser obtenido de acuerdo a la siguiente identidad; a = 200 t + p, donde “t”, es cualquier entero y “p” es cualquiera de los siguientes valores: 3, 11, 13, 19, 21, 27, 29, 37, 53, 59, 61, 67, 69, 77, 83, 91.
- El valor seleccionado de “m” puede ser 10^d. Si m es igual a 10 y d > = 5, el periodo del generador es 5 x 10 ^d-2.
Xn+1 =
3Xn mod 100 y Xo = 17
n
|
Xn
|
aXn/m
|
Xn+1
|
0
|
17
|
51/100
|
51
|
1
|
51
|
153/100
|
53
|
2
|
53
|
159/100
|
59
|
3
|
59
|
177/100
|
77
|
4
|
77
|
231/100
|
31
|
5
|
31
|
93/100
|
93
|
6
|
93
|
279/100
|
79
|
7
|
79
|
237/100
|
37
|
8
|
37
|
111/100
|
11
|
9
|
11
|
33/100
|
33
|
10
|
33
|
99/100
|
99
|
11
|
99
|
297/100
|
97
|
12
|
97
|
291/100
|
91
|
13
|
91
|
273/100
|
73
|
14
|
73
|
219/100
|
19
|
15
|
19
|
57/100
|
57
|
16
|
57
|
171/100
|
71
|
17
|
71
|
213/100
|
13
|
18
|
13
|
39/100
|
39
|
19
|
39
|
117/100
|
17
|
20
|
17
|
-
|
-
|
PRUEBA DE
POKER
0.06141(1P) 0.72484(1P) 0.94107(TD) 0.56766(T) 0.14411(TP) 0.01792(TD) 0.48999(T) 0.18590(TD) 0.06060(TP) 0.11223(2P) 0.52953(1P) 0.50502(2P) 0.30444(T)
0.70688(1P) 0.25357(1P) 0.04127(TD) 0.67347(1P) 0.28103(TD) 0.99367(1P) 0.44598(1P) 0.27813(TD) 0.62182(1P) 0.87648(1P) 0.64794(1P) 0.31555(T) 0.73997(2P) 0.09099(TP)
Categorías
|
Oi
|
Ep
|
Ei
|
|
(TD) Todos Diferentes
|
8
|
0.3014
|
9.042
|
|
(1P) Un Par
|
12
|
0.5040
|
15.120
|
|
(2P) Dos Pares
|
3
|
0.1880
|
3.240
|
|
(TP)Una Tercia y un Par
|
3
|
0.0090
|
0.270
|
|
(T)Tercia
|
4
|
0.0720
|
2.16
|
|
(P)Poker
|
0
|
0.0045
|
0.135
|
|
(Q)Quintilla
|
0
|
0.0001
|
0.003
|
CHI-CUADRADA
• Se usa cuando se trabaja con variables nominales (categorías o grupos).
• Responder la pregunta: si las frecuencias observadas, difiere de la
frecuencia esperada.
• Utiliza los recuentros.
EJEMPLO:
Si 20 de 40 escolares varones con hipoidismo primario
(por defecto) los niveles de TSH están elevados en suero y 5 de 38 varones
normales muestran elevaciones similares.
HIPOTESIS NULA
Pacientes con la enfermedad no tienen niveles altos de TSH en suero.
KOLMOGOROV
Es una prueba estadísitca que sirve para determinar si un conjunto ri
cumple la propiedad de uniformidad.
Es recomendable aplicarla en conjuntos pequeños, por ejemplo n<20.
— Procedimiento es el siguiente:
- Ordenar de menor a mayor los números del conjunto ri.
- Determinar los valores de D+, D- y D con las siguientes ecuaciones.
Las fórmulas son:
Determinar el valor crítico Dα,n
de acuerdo con la tabla de valores críticos de Kolmogorov-Smirnov par aun grado
de confianza α, y según el tamaño de la muestra n.
- Si el valor crítico D es mayor que el valor crítico Dα,n se concluye que los números del conjunto ri, no siguen una distribución uniforme. Caso contrario no existiría diferencia significativa.
- D>Dan
EJEMPLO
Realizar la prueba, con un
nivel de confianza de 90%, al siguiente conjunto ri de 10 números
ri = (0.97, 0.11, 0.65, 0.26, 0.98, 0.03,
0.13, 0.89, 0.21, 0.69)
Ordenada es:
(0.03 – 0.11 – 0.13 – 0.21 – 0.26 – 0.65 – 0.69 – 0.89 – 0.97 – 0.98)
De acuerdo a las tablas de valores para la prueba, el valor crítico
correspondiente n = 10 es:
D = 0.368, que resulta menor al valor D = 1.04, por tanto, se concluye
que los números del conjunto ri no se distribuyen uniformemente
D (1.04)> Dα,n (0.368) o hay uniformidad
PRUEBA DE INDEPENDENCIA
Las pruebas de independencia consiste en demostrar
que los números generados son estadísticamente independientes entre si, esto
es, que no dependen uno de otro. Para esto se propone la siguiente hipótesis:
·
HO : r independiente
·
Hi
Dependiente
Para realizar esta prueba de hipótesis existen
varios métodos, puede seleccionarse cualquiera de la siguiente lista:
- Prueba de poker
- Prueba de corridas arriba y abajo
- Pruebas de corridas arriba y debajo de la media
- Prueba de la longitud de las corridas
- Prueba de distancia
- Prueba de series
- Prueba de huecos
Autocorrelación
Mide la correlación entre los valores de la serie
distanciados en un lapso de tiempo k. Se define como la correlación cruzada de
la señal consigo misma. Resulta de gran utilidad.
PRUEBAS DE HUECO
Consiste en suprimir de un texto una serie de
palabras seleccionadas en virtud que representan los aspectos que se requieren
medir. La tarea del candidato es deducir, por el contexto, la palabra eliminada
y rescribirla para determinar la palabra dada es correcta o incorrecta.
PRUEBA DE POKER
Examina en forma individual los dígitos del numero
pseudo-aleatorio. La forma como esta prueba se realiza es tomando numeros
decimales con 5 digitos a la vez y clasificándolos como; par, dos pares,
tercia, poker, quintilla, y todos diferentes. La prueba poker se puede realizar
con 2, 4 y 5 decimales.
Procedimiento:
·
Determinar la categoría de cada numero del conjunto ri
·
Contabilizar los numeros ri de la misma categoría o clase para obtener
la frecuencia observada (Oi)
·
Calcular el estadístico de la prueba X^2n
·
Finalmente comparar el
estadístico de X^2º
PRUEBA DE Q DE YULE
Es una medida de asociación creada por el
estadístico escoces George Udny Yule, se utiliza en cuadros estadísticos
llamado contingencia.
Variables
nominales
Restricciones:
·
Tener en cuenta que son numeros
positivos, solo pueden tomar valores comprendidos entre cero y uno.
·
Cuando se acercan a un cero, indican
independencia o asociación muy débil entre las variables.
MÉTODO DE
MONTE CARLO
Se agrupan una
serie de procediemientos que alcanzan distribuciones de variables aleatorias
usando una simulación de numeros aleatorios. Da solución a una gran variedad de
problemas matemáticos haciendo experimentos con muestreos estadísticos en una
computadora. Se usa para analizar problemas que no tienen un componente
aleatorio explicito.
Fue creada
para resolver integrales que no se pueden resolver por métodos análiticos, para
solucionar estos integrales se usaron numeros aleatorios. Posteriormente se
utilizo para cualquier esquema que emplee numeros aleatorios, usando variables
aleatorias con distribuciones de probabilidad conocidos, para resolver
problemas estocásticos y determiniticos.
MÉTODO DE
COMPOSICIÓN
Genera valores
de variables aleatorias no- uniformes usando también el método de composición,
en la cual la distribución de
probabilidad f(x) se expresa como una mezcla de varias distribuciones de
probabilidad f(x), seleccionadas adecuadamente.
Este
procedimiento se basa en el objetivo de minimizar el tiempo de computación
requerida para la generalización de valores de la variable aleatoria analizada.
También
conocida como método mixto, permite generar variables aleatorias “x”, cuando
estas provienen de una función de densidad fx que pueda expresarse como la
combinación convexa de distribuciones de probabilidad fi(x).
Algunas de las
distribuciones mas conocidas que pueden expresarse como una combinación convexa
son: triangular, Laplace, y trapezoidal. Procedimiento general de generación es
el siguiente:
- Calcular la probabilidad de cada una de las distribuciones fi(x)
- Asegurar que cada función fi(x) sea función de densidad
- Obtener mediante el método de la transformada inversa, las expresiones para generar variables aleatorias de cada una de las distribuciones fi(x)
- Genera un numero pseudoaleatorio ri que permita definir el valor de IA(x)
- Seleccionar la función generadora correspondiente a la función fi(x)
- Generar un segundo numero pseudoaleatorio y sustituirlo en la funión generada anteriormente para obtener y.
PRUEBA DE
BONDAD DEL AJUSTE
Cuando se
realizan investigaciones, con frecuencias importante obtener información a
través de una muestra. Algunos estudios producen resultados sobre los que no
podemos afirmar que se distribuyen.
En estos casos
debemos emplear técnicas no paramétricas que se utilizan ampliamente en las
aplicaciones de las ciencias sociales, cuando se pueden asumir a priori que los
datos de una muestra se ajusten a una distribución normal. Ahora nos ocuparemos
del problema de verificar si de un conjunto de datos se pueden afirmar que
proviene de que proviene.
Estadística No Parametrica
La estadística
no paramétrica es una rama de la estadística las pruebas y modelos estadísticos
cuya distribución subyacente no se ajuste a los llamados criterios
paramétricos. Las pruebas paramétricas no asumen ningún parámetro de
distribución de las variables muéstrales.
Las pruebas
paramétricas asumen los parámetros de las variable (media y varianza) y un tipo
de distribución normal.
Las pruebas no
paramétricas no asumen ningún parámetro de distribución de las variables
muestrales.
Para resolver
este problema utilizaremos unas pruebas estadísticas que reciben el nombre
general de pruebas de bondad de ajuste.
Este calculo
de pruebas es sencillo, desde el punto de vista manual y matemático, sin
embargo y siguiendo con nuestra practica, facilita el trabajo hacerlo con la
hoja de calculo de Excel.
Prueba Fisher
Es la prueba
estadística de elección cuando la prueba de Chi-cuadrada no puede ser empleada
por tamaño muestral insufiente.
Prueba de Chi-Cuadrada
Se basa en la
hipótesis nula (Ho) de que no hay diferencias significativas entre la
distribución muestral y la teoría.
Mientras que la hipótesis alternativa (H1), siempre se enuncia como que los
datos no siguen la distribución supuesta.
Estadístico de Prueba
El estadístico
de prueba esta definido como la sumatoria de los residuos expresados en
términos de las frecuencias esperadas para cada una de las clases.
Interpretación.
Cuanto mayor sea el valor de , menos verosímil es que la hipótesis Ho sea
correcto. De la misma forma, cuanto más se aproxima a cero el valor de
Chi-cuadrada.
Si = 0. La frecuencia teórica y observada
concuerda exactamente.
Si > 0. Mientras mayor es la diferencia mayor
es la discrepancia.
En la
practica: si Ho = 0 no existe diferencia significativa es la distribución de la
frecuencia observada y la distribución teórica específicamente los mismos
parámetros.
MÉTODO DE
CONVOLUCIÓN
La
distribución de la suma de dos o mas variables aleatorias independientes es
llamada la convolución de las distribuciones de las variablesoriginales. El
método de convolución es entonces la suma de dos variables aleatorias para
obtener una variable aleatoria con la distribución de probabilidad deseada.
Puede ser usada para obtener variables con distribuciones Erlang y binomiales.
Antes de
comenzar con el método, identifiquemos los valores de cada señal.
Una vez que
tenemos identificados los valores de cada señal, comenzamos a resolver.
Primero,
hacemos una tabla que contendrá:
- Cantidad de columnas = cantidad de puntos a[n]+1
- Cantidad de filas = cantidad de puntos de a[n]+ de puntos de b[n]
- En el ejemplo que estamos realizando quedaría:
- Cantidad de columnas = 6+1 = 7
- Cantidad de filas = 6+4 = 10
Segundo, hay
que llenar la tabla. En la primera fila, colocamos los valores de a[n]
Para calcular
el elemento de y[0], tomamos en cuenta siempre la primera fila la que continue
los elementos de a[n] y la fila correspondiente al elemento que estamos
calculando.
Ejemplo:
No hay comentarios:
Publicar un comentario