Independientemente del proceso o procedimiento que se utilice para la generacion de los números rectangulares, estos deben de poseer ciertas características deseables que aseguren o aumenten la confiabilidad de los resultados de la simulación. Tales características son:
1.- Uniformemente distribuidos.
2.- Estadísticamente independientes.
3.- Reproducibles.
4.- Periodo largo (sin repetición dentro de un longitud determinada de la sucesión)
5.- Generados a través de un método rápido.
viernes, 14 de septiembre de 2012
martes, 11 de septiembre de 2012
Generación de números aleatorios rectangulares
Para la realización de una simulación se requieren números aleatorios en el intervalo (0,1), a los cuales se hará referencia como rj, es decir, una secuencia rj={r1,r2,r3,..., rn} que contiene n números, todos ellos diferentes, nrecibe el nombre de periodo o ciclo de vida del generador que creó la secuenciarj.
Los rj constituyen la parte medular de la simulación de procesos estocásticos y generalmente se usan para modelar el comportamiento de variables aleatorias tanto continuas como discretas.
En todos los experimentos de simulación existe la necesidad de generar valores de variables aleatorias que representan a una cierta distribución de probabilidad. Durante un experimento de simulación, el proceso de generar un valor de la variable aleatoria de una distribución particular, puede repetirse tantas veces como se desee y tantas veces como distribuciones de probabilidad existan en el experimento de simulación. Sin embargo, es conveniente señalar que el proceso de generar variables aleatorias no uniformes se hace a partir de la generación de números rectangulares.
Los rj constituyen la parte medular de la simulación de procesos estocásticos y generalmente se usan para modelar el comportamiento de variables aleatorias tanto continuas como discretas.
En todos los experimentos de simulación existe la necesidad de generar valores de variables aleatorias que representan a una cierta distribución de probabilidad. Durante un experimento de simulación, el proceso de generar un valor de la variable aleatoria de una distribución particular, puede repetirse tantas veces como se desee y tantas veces como distribuciones de probabilidad existan en el experimento de simulación. Sin embargo, es conveniente señalar que el proceso de generar variables aleatorias no uniformes se hace a partir de la generación de números rectangulares.
Algunos
autores como Tocher, han sugerido tres formas para obtener los números
rectangulares:
- La provisión externa,
- La generación interna a partir de un proceso físico al azar y
- La generación interna de sucesiones de dígitos por medio de una relación de recurrencia.
El
primer método implica tener los números aleatorios, como por ejemplo las tablas
de la Rand y tratar a estos números como
datos de entrada para el problema que se está simulando.
El tercer método, y uno de los más aceptados, implica la generación de estos números rectangulares a través de una relación de recurrencia.
El enfoque
moderno es usar una computadora para generar los números mediante alguna formula
matemática (o relación de recurrencia) con lo que nos
encontramos utilizando un método deterministico para obtener
una secuencia de números que dan la apariencia de ser aleatorios
cuando en realidad no lo son, dado que en algún momento determinado esta lista
comenzará a repetirse; el objetivo en si es generar una lista lo
suficientemente larga de valores que permita realizar la simulación antes de
llegar al comienzo del ciclo. A esta serie de números que parecen ser
aleatorios se les denomina pseudoaleatorios.
Los números pseudoaleatorios
Para poder realizar una simulación que incluya variabilidad dentro de sus eventos, es preciso generar una serie de números que sean aleatorios por sí mismos, y que su aleatoriedad se extrapole al modelo de simulacion que se está construyendo.
Como se puede advertir, en la construccion de un modelo los números aleatorios juegan un papel relevante.
Cuando un conjunto de números se comporta de manera muy similar a un conjunto de números totalmente aleatorios se les denomina números pseudoaleatorios.
Casi todas las aplicaciones comerciales tienen varios generadores de números pseudoaleatorios mediante lascuales es posible obtener un conjunto muy grande de números sin mostrar correlación entre ellos.
Los numeros rectangulares generados a través de una relación de recurrencia se denominan pseudoaleatorios, por ser una sucesión de dígitos generados mediante una regla puramente determinística. Sin embargo esta objeción puede superarse, al menos parcialmente, al tomar el punto de vista un tanto pragmático de que una sucesión puede considerarse aleatoria si satisface un cierto conjunto de pruebas estadísticas de aleatoriedad.
Introducción a la simulación*
La simulación ayuda a conocer como las cosas que en teoria "funcionan siempre" realmente funcionan. Por ejemplo existe una transformación conocida como la transformación "tienda" la cual es facil probar que es invariante con respecto a la distribución uniforme (0,1), sin embargo cuando se realiza un estudio de simulación se puede ver que este generador tiene un comportamiento desastroso ya que converge para un valor fijo. Cuestiones como estas son donde la simulación es util pues ayuda a ver "más allá de lo evidente".
Aqui les dejo algunos ejemplos en donde personalmente he realizado estudios de simulación para verificar algunos aspectos importantes:
- Podemos estar simulando modelos de sobrevivencia, con diferentes porcentajes de observaciones censuradas, o tipos de errores con diferentes distribuciones (simetricas, asimetricas, de colas pesadas, de colas livianas, etc) y ver si un estimador propuesto tiene un comportamiendo satisfactorio en ciertas condiciones,
- Simular modelos de volatilidad de los mercados financieros y ver si mejora el ajuste a medida que el desarrollo en el area se ha ido dando (modelos de volatilidad con asimetrica de apalancamiento, o con asimetria en los errores, etc.),
- Verificar si un algoritmo de clasificación es mejor que otro (en funcion del numero de variables, recorrido de la misma, cantidad de observaciones, medida de agrupamiento, etc.),
- Analizar la convergencia de distintos metodos de aproximación,
- Resolver integrales que analiticamente son complicadas,
- Calcular probabilidades de distribuciones "dificiles",
- Mejorar la estimación en ciertos modelos utilizando metodos computaciones intensivos como Monte Carlo o Bootstrap, etc. etc. etc.
Personalmente me gusta simular y gracias a eso he podido detectar algunas diferencia entre algunos metodos que resuelven el mismo problema, diferencias no aparecen en los libros, sino que a base de "simple curiosidad" he podido detectar.
Si bien la simulación es importante esta debe ser realizada cuidadosamente, pues se cae frecuentemente en el error de "simular perfectamente lo que no queriamos simular" o "considerar en la simulación los casos que no eran de nuestro interés". Simular no siempre es facil, pero definitivamente si el estudio es realizado correctamente los resultados obtenidos valen la pena.
* Este artículo, el cual reproduzco con ligeros cambios,
fue publicado originalmente por Carlos Trucios Mata en su blog Analisis de datos.
Suscribirse a:
Entradas (Atom)