UNIDAD III. GENERACIÓN DE VARIABLES ALEATORIAS


TEMARIO

3.1 Introducción.
3.2 Variables aleatorias discretas.
3.3 Variables aleatorias continuas.
3.4 Métodos para generar variables aleatorias.
3.5 Procedimientos especiales.
 
MÉTODO DE GENERACIÓN DE NUMEROS ALEATORIOS

Método Conguencial Mixto

Este genera una sucesión de números enteros aleatorios en el cual el proximo número pseudoaleatorio, es determinado a partir del último número generado, es decir, el número pseudoaleatorio Xn+1, es derivado a partir del numero pseudoaleatorio Xn. Para en caso particular del generador congruencial mixto, la relación de recurrencia es la siguiente: Xn+1 = (aXn + c) mod m, donde:
  • Xo = la semilla (Xo > 0)
  • a = el multiplicador (a > 0)
  • c = constante aditiva (c > 0)
  • m = modulo (m > Xo, m > 0 y m > c )
a = 5, c = 7, Xo = 4, m = 8


n
Xn
(5Xn + 7)/8
Xn+1
Números uniformes
0
4
27/8
3
3/8
1
3
22/8
6
6/8
2
6
37/8
5
5/8
3
5
32/8
0
0/8
4
0
7/8
7
7/8
5
7
42/8
2
2/8
6
2
17/8
1
1/8
7
1
12/8
4
4/8
8
4
-
-
-

a = 7, c = 7, Xo = 7, m =10


n
Xn
(5Xn + 7)/8
Xn+1
Números uniformes
0
7
56/10
6
6/10
1
6
49/10
9
9/10
2
9
70/10
0
0/10
3
0
7/10
7
7/10
4
7
-
-
-

a = 8, c = 16, Xo = 15, m =100


n
Xn
(5Xn + 7)/8
Xn+1
Números uniformes
0
15
136/100
36
36/100
1
36
304/100
4
4/100
2
4
48/10
48
48/100
3
48
400/100
0
0/100
4
0
16/100
16
16/100
5
16
144/100
44
44/100
6
44
368/100
68
68/100
7
68
560/100
60
60/100
8
60
496/100
96
96/100
9
96
784/100
84
84/100
10
84
688/100
88
88/100
11
88
720/100
20
20/100
12
20
176/100
76
76/100
13
76
624/100
24
24/100
14
24
208/100
8
8/100
15
8
80/100
80
80/100
16
80
656/100
56
56/100
17
56
464/100
64
64/100
18
64
528/100
28
28/100
19
28
240/100
40
40/100
20
40
336/100
36
36/100
21
36
304/100
4
-
 
Medios al cuadrado

Este algoritmo no congruencial requiere un numero entero denotador (llamado semilla) con D digitos, el cual es elevado al cuadrado para seleccionar del resultado los D digitos del centro; el primer numero ri se determina simplemente anteponiendo el cero a esos digitos.
Para obtener el segundo r se sigue el mismo procedimiento, solo que ahora se eleva al cuadrado los d digitos del centro que se seleccionaron para obtener el primer r. Este método se repite hasta obtener n números r.
Pasos:
  1. Seleccionar una semilla (Xo) con d digitos (D > 3).
  2. Sea X0 = resultado de elevar Xo al cuadrado; sea X1 digitos del centro, y sea ri = 0, d digitos del centro.
  3.    Sea yi = resultado de elevar Xi al cuadrado; sea Xi+1 = a los dígitos del centro, y sea ri = 0, d dígitos del centro para toda i = 1,  2, 3, …n.   
  4.  Repetir el paso tres hasta obtener los n números ri deseados. 
NOTA: si no es posible obtener los D dígitos del centro del numero yi, agregue ceros a la izquierda del numero yi.
Generar los primeros 14 números a partir de 3825, con 4 digitos.

Número
Resultado
3825^2
14630625
6306^2
39765636
7656^2
58614336
6143^2
37736449
7364^2
54228496
2284^2
05216656
2166^2
04691556
6915^2
47817225
8172^2
66781584
7815^2
61074225
0742^2
00550564
5504^2
30305025
3050^2
09302500
3025^2
09150625

MÉTODO MULTIPLICATIVO
Para este generador se recomienda una selección adecuada para los valores de los parámetros a, Xo y m; con el fin de asegurar un periodo máximo para las sucesiones generadas por este método:
Número Decimal (sistema); los valores de los parámetros deben ser seleccionadas de acuerdo a los siguientes criterios:
  •   El valor de la semilla puede ser cualquiera entero impar no divisible entre 2 o 5.
  •   Debe ser relativamente primo a “m”.
  •   El valor seleccionado de “a”, debe ser obtenido de acuerdo a la siguiente identidad; a = 200 t + p, donde “t”, es cualquier entero y “p” es cualquiera de los siguientes valores: 3, 11, 13, 19, 21, 27, 29, 37, 53, 59, 61, 67, 69, 77, 83, 91.
  • El valor seleccionado de “m” puede ser 10^d. Si m es igual a 10 y d > = 5, el periodo del generador es 5 x 10 ^d-2.
Xn+1 = 3Xn mod 100 y  Xo = 17
n
Xn
aXn/m
Xn+1
0
17
51/100
51
1
51
153/100
53
2
53
159/100
59
3
59
177/100
77
4
77
231/100
31
5
31
93/100
93
6
93
279/100
79
7
79
237/100
37
8
37
111/100
11
9
11
33/100
33
10
33
99/100
99
11
99
297/100
97
12
97
291/100
91
13
91
273/100
73
14
73
219/100
19
15
19
57/100
57
16
57
171/100
71
17
71
213/100
13
18
13
39/100
39
19
39
117/100
17
20
17
-
-

PRUEBA DE POKER
0.06141(1P)     0.72484(1P)     0.94107(TD)     0.56766(T)     0.14411(TP)    0.01792(TD)    0.48999(T)      0.18590(TD)     0.06060(TP)     0.11223(2P)    0.52953(1P)    0.50502(2P)    0.30444(T)      0.70688(1P)      0.25357(1P)      0.04127(TD)   0.67347(1P)    0.28103(TD)    0.99367(1P)    0.44598(1P)      0.27813(TD)     0.62182(1P)     0.87648(1P)    0.64794(1P)   0.31555(T)      0.73997(2P)      0.09099(TP)

Categorías
Oi
Ep
Ei

(TD) Todos Diferentes
            8
0.3014
9.042

(1P) Un Par
12
0.5040
15.120

(2P) Dos Pares
3
0.1880
3.240

(TP)Una Tercia y un Par
3
0.0090
0.270

(T)Tercia
4
0.0720
2.16

(P)Poker
0
0.0045
0.135

(Q)Quintilla
0
0.0001
0.003


CHI-CUADRADA
         Se usa cuando se trabaja con variables nominales (categorías o grupos).
         Responder la pregunta: si las frecuencias observadas, difiere de la frecuencia esperada.
         Utiliza los recuentros.
EJEMPLO:
            Si 20 de 40  escolares varones con hipoidismo primario (por defecto) los niveles de TSH están elevados en suero y 5 de 38 varones normales muestran elevaciones similares.
HIPOTESIS NULA
Pacientes con la enfermedad no tienen niveles altos de TSH en suero.






KOLMOGOROV
Es una prueba estadísitca que sirve para determinar si un conjunto ri cumple la propiedad de uniformidad.
Es recomendable aplicarla en conjuntos pequeños, por ejemplo n<20.
  Procedimiento es el siguiente:
  1. Ordenar de menor a mayor los números del conjunto ri.
  2. Determinar los valores de D+, D- y D con las siguientes ecuaciones.
Las fórmulas son:




Determinar el valor crítico Dα,n de acuerdo con la tabla de valores críticos de Kolmogorov-Smirnov par aun grado de confianza α, y según el tamaño de la muestra n.
  1. Si el valor crítico D es mayor que el valor crítico Dα,n se concluye que los números del conjunto ri, no siguen una distribución uniforme. Caso contrario no existiría diferencia significativa.
  2. D>Dan
EJEMPLO
Realizar la prueba, con un nivel de confianza de 90%, al siguiente conjunto ri de 10 números
 ri = (0.97, 0.11, 0.65, 0.26, 0.98, 0.03, 0.13, 0.89, 0.21, 0.69)
Ordenada es:
(0.03 – 0.11 – 0.13 – 0.21 – 0.26 – 0.65 – 0.69 – 0.89 – 0.97 – 0.98)
 De acuerdo a las tablas de valores para la prueba, el valor crítico correspondiente n = 10 es:
 D = 0.368, que resulta menor al valor D = 1.04, por tanto, se concluye que los números del conjunto ri no se distribuyen uniformemente
 D (1.04)> Dα,n (0.368) o hay uniformidad

PRUEBA DE INDEPENDENCIA
Las pruebas de independencia consiste en demostrar que los números generados son estadísticamente independientes entre si, esto es, que no dependen uno de otro. Para esto se propone la siguiente hipótesis:
·         HO : r  independiente
·         Hi
Dependiente
Para realizar esta prueba de hipótesis existen varios métodos, puede seleccionarse cualquiera de la siguiente lista:
  •  Prueba de poker
  •  Prueba de corridas arriba y abajo
  •  Pruebas de corridas arriba y debajo de la media
  •  Prueba de la longitud de las corridas
  • Prueba de distancia
  • Prueba de series
  • Prueba de huecos
Autocorrelación
Mide la correlación entre los valores de la serie distanciados en un lapso de tiempo k. Se define como la correlación cruzada de la señal consigo misma. Resulta de gran utilidad.

PRUEBAS DE HUECO
Consiste en suprimir de un texto una serie de palabras seleccionadas en virtud que representan los aspectos que se requieren medir. La tarea del candidato es deducir, por el contexto, la palabra eliminada y rescribirla para determinar la palabra dada es correcta o incorrecta.

PRUEBA DE POKER
Examina en forma individual los dígitos del numero pseudo-aleatorio. La forma como esta prueba se realiza es tomando numeros decimales con 5 digitos a la vez y clasificándolos como; par, dos pares, tercia, poker, quintilla, y todos diferentes. La prueba poker se puede realizar con 2, 4 y 5 decimales.
Procedimiento:
·         Determinar la categoría de cada numero del conjunto ri
·         Contabilizar los numeros ri de la misma categoría o clase para obtener la frecuencia observada (Oi)
·         Calcular el estadístico de la prueba X^2n
·         Finalmente  comparar el estadístico de X^2º

PRUEBA DE Q DE YULE
Es una medida de asociación creada por el estadístico escoces George Udny Yule, se utiliza en cuadros estadísticos llamado contingencia.

Variables nominales
Restricciones:
·         Tener en cuenta que son numeros positivos, solo pueden tomar valores comprendidos entre cero y uno.
·         Cuando se acercan a un cero, indican independencia o asociación muy débil entre las variables.

MÉTODO DE MONTE CARLO
Se agrupan una serie de procediemientos que alcanzan distribuciones de variables aleatorias usando una simulación de numeros aleatorios. Da solución a una gran variedad de problemas matemáticos haciendo experimentos con muestreos estadísticos en una computadora. Se usa para analizar problemas que no tienen un componente aleatorio explicito.
Fue creada para resolver integrales que no se pueden resolver por métodos análiticos, para solucionar estos integrales se usaron numeros aleatorios. Posteriormente se utilizo para cualquier esquema que emplee numeros aleatorios, usando variables aleatorias con distribuciones de probabilidad conocidos, para resolver problemas estocásticos y determiniticos.

MÉTODO DE COMPOSICIÓN
Genera valores de variables aleatorias no- uniformes usando también el método de composición, en la cual la distribución  de probabilidad f(x) se expresa como una mezcla de varias distribuciones de probabilidad f(x), seleccionadas adecuadamente.
Este procedimiento se basa en el objetivo de minimizar el tiempo de computación requerida para la generalización de valores de la variable aleatoria analizada.
También conocida como método mixto, permite generar variables aleatorias “x”, cuando estas provienen de una función de densidad fx que pueda expresarse como la combinación convexa de distribuciones de probabilidad fi(x).
Algunas de las distribuciones mas conocidas que pueden expresarse como una combinación convexa son: triangular, Laplace, y trapezoidal. Procedimiento general de generación es el siguiente:
  1.  Calcular la probabilidad de cada una de las distribuciones fi(x)
  2.  Asegurar que cada función fi(x) sea función de densidad
  3.  Obtener mediante el método de la transformada inversa, las expresiones para generar variables aleatorias de cada una de las distribuciones fi(x)
  4.  Genera un numero pseudoaleatorio ri que permita definir el valor de IA(x)
  5.  Seleccionar la función generadora correspondiente a la función fi(x)
  6. Generar un segundo numero pseudoaleatorio y sustituirlo en la funión generada anteriormente para obtener y.



PRUEBA DE BONDAD DEL AJUSTE
Cuando se realizan investigaciones, con frecuencias importante obtener información a través de una muestra. Algunos estudios producen resultados sobre los que no podemos afirmar que se distribuyen.
En estos casos debemos emplear técnicas no paramétricas que se utilizan ampliamente en las aplicaciones de las ciencias sociales, cuando se pueden asumir a priori que los datos de una muestra se ajusten a una distribución normal. Ahora nos ocuparemos del problema de verificar si de un conjunto de datos se pueden afirmar que proviene de que proviene.
Estadística No Parametrica
La estadística no paramétrica es una rama de la estadística las pruebas y modelos estadísticos cuya distribución subyacente no se ajuste a los llamados criterios paramétricos. Las pruebas paramétricas no asumen ningún parámetro de distribución de las variables muéstrales.
Las pruebas paramétricas asumen los parámetros de las variable (media y varianza) y un tipo de distribución normal.
Las pruebas no paramétricas no asumen ningún parámetro de distribución de las variables muestrales.
Para resolver este problema utilizaremos unas pruebas estadísticas que reciben el nombre general de pruebas de bondad de ajuste.
Este calculo de pruebas es sencillo, desde el punto de vista manual y matemático, sin embargo y siguiendo con nuestra practica, facilita el trabajo hacerlo con la hoja de calculo de Excel.
Prueba Fisher
Es la prueba estadística de elección cuando la prueba de Chi-cuadrada no puede ser empleada por tamaño muestral insufiente.
Prueba de Chi-Cuadrada
Se basa en la hipótesis nula (Ho) de que no hay diferencias significativas entre la distribución  muestral y la teoría. Mientras que la hipótesis alternativa (H1), siempre se enuncia como que los datos no siguen la distribución supuesta.
Estadístico de Prueba
El estadístico de prueba esta definido como la sumatoria de los residuos expresados en términos de las frecuencias esperadas para cada una de las clases.
Interpretación. Cuanto mayor sea el valor de , menos verosímil es que la hipótesis Ho sea correcto. De la misma forma, cuanto más se aproxima a cero el valor de Chi-cuadrada.
Si  = 0. La frecuencia teórica y observada concuerda exactamente.
Si  > 0. Mientras mayor es la diferencia mayor es la discrepancia.
En la practica: si Ho = 0 no existe diferencia significativa es la distribución de la frecuencia observada y la distribución teórica específicamente los mismos parámetros.
 
 
MÉTODO DE CONVOLUCIÓN
La distribución de la suma de dos o mas variables aleatorias independientes es llamada la convolución de las distribuciones de las variablesoriginales. El método de convolución es entonces la suma de dos variables aleatorias para obtener una variable aleatoria con la distribución de probabilidad deseada. Puede ser usada para obtener variables con distribuciones Erlang y binomiales.
Antes de comenzar con el método, identifiquemos los valores de cada señal.

Una vez que tenemos identificados los valores de cada señal, comenzamos a resolver.
Primero, hacemos una tabla que contendrá:
  •  Cantidad de columnas = cantidad de puntos a[n]+1
  •  Cantidad de filas = cantidad de puntos de a[n]+ de puntos de b[n] 
  • En el ejemplo que estamos realizando quedaría:
  • Cantidad de columnas = 6+1 = 7
  • Cantidad de filas = 6+4 = 10
Segundo, hay que llenar la tabla. En la primera fila, colocamos los valores de a[n]

Para calcular el elemento de y[0], tomamos en cuenta siempre la primera fila la que continue los elementos de a[n] y la fila correspondiente al elemento que estamos calculando.
Ejemplo:

No hay comentarios:

Publicar un comentario