free web hosting | free hosting | Business Hosting | Free Website Submission | shopping cart | php hosting

DISTRIBUCIONES DE PROBABILIDAD

 

Introducción.

Un modelo es una simplificación de la realidad. Un modelo probabilístico es un modelo matemático que describe el comportamiento de una variable aleatoria. Es una función que depende de los valores de la variable aleatoria, y de otras cantidades que caracterizan a una población en particular y que se denominan parámetros del modelo.

En el proceso de modelación, es necesario seguir los siguientes pasos:

 

  1. Seleccionar el modelo más apropiado.
  2. Ajustar el modelo (calcular el valor de sus parámetros).
  3. Verificar el modelo.
  4. Decidir su aceptación o volver al paso 1.

 

Para ejecutar el paso 1, podemos optar por una amplia gama de modelos de probabilidad, desarrollados para representar distintos tipos de variables y diferentes fenómenos aleatorios. Por lo tanto, el problema se reduce a elegir el modelo más apropiado para el caso en estudio.

 

Para ejecutar el paso 2, es necesario recopilar una muestra representativa de la población en estudio y calcular las cantidades necesarias como para evaluar los parámetros del modelo.

La distribución binomial.

 

Esta distribución describe una variedad de procesos de interés para los administradores y describe datos discretos, no continuos, que son resultado de un experimento conocido como proceso de Bernoulli.

Uso del proceso de Bernoulli.

 

Podemos describir el proceso de la manera siguiente:

 

  1. Cada intento tiene sólo dos resultados posibles.
  2. La probabilidad del resultado de cualquier intento permanece fijo con respecto al tiempo.
  3. Los intentos son estadísticamente independientes.

 

Fórmula binomial:

 

Probabilidad de r éxitos en n ensayos = n! / [r! (n - r)!] pr qn - r

 

p = probabilidad característica o probabilidad de tener éxito

q = 1 - p = probabilidad de fracaso

r = número de éxitos deseados

n = número de intentos hechos

 

 

 

Generalizaciones:

 

 

Medidas de tendencia central y de dispersión para la distribución binomial.

 

La distribución binomial tiene un valor esperado o media y una desviación estándar.

 

 

 

Cumplimiento de las condiciones del proceso de Bernoulli.

 

Necesitamos ser cuidadosos en el uso de la distribución binomial de la probabilidad y asegurar que se cumplen las tres condiciones necesarias, en particular las condiciones 2 y 3. La condición 2 requiere que la probabilidad del resultado de cualquier intento permanezca fija en el tiempo. La condición 3 requiere que los ensayos o intentos de un proceso de Bernoulli sean estadísticamente independientes, es decir, que el resultado de un intento no puede afectar de ningún modo el resultado de cualquier otro intento.

 

La distribución de Poisson.

 

La distribución de Poisson se utiliza para describir cierto tipo de procesos, entre los que se encuentran la distribución de llamadas telefónicas que llegan a un conmutador, la demanda (necesidades) de los pacientes que requieren servicio en una institución de salud, las llegadas de camiones a una caseta de cobro y el número de accidentes registrados en una cierta intersección de calles. Estos ejemplos tienen en común un elemento: pueden ser descritos mediante una variable aleatoria discreta que toma valores enteros (0, 1, 2...).

 

Características de los procesos que producen una distribución de probabilidad de Poisson.

 

  1. El promedio (la media) del número de eventos que se producen por hora, puede estimarse a partir de datos que se tengan disponibles.
  2. Si dividimos la hora pico en periodos (intervalos) de un segundo cada uno, encontraremos que las siguientes afirmaciones son verdaderas:

 

 

Cálculo de la probabilidad de Poisson.

 

La letra X por lo general representa a una variable discreta y puede tomar valores enteros. Utilizamos la letra X para representar a la variable aleatoria y la letra x para señalar un valor específico que esta variable pueda tomar. La probabilidad de tener exactamente x presentaciones en una distribución de Poisson se calcula con la fórmula:

 

Image2.jpe (24560 bytes)

 

La distribución de Poisson como una aproximación a la distribución binomial.

La distribución de Poisson puede ser un razonable aproximación a la binomial, pero sólo bajo ciertas condiciones. Tales condiciones se presentan cuando n es grande y p es pequeña, esto es, cuando el número de ensayos es grande y la probabilidad binomial de tener éxito es pequeña. La regla que utilizan con más frecuencia los estadísticos es que la distribución de Poisson es una buena aproximación de la distribución binomial cuando n es igual o mayor que 20 y p es igual o menor que 0,05. En los casos en que se cumplen estas condiciones, podemos sustituir la media de la distribución binomial (np) en lugar de la media de la distribución de Poisson (l ).

 

SUGERENCIA:

 

El uso de una distribución para aproximar a otra es una práctica bastante común en probabilidad y estadística. La idea consiste en buscar situaciones en las que una distribución (como la de Poisson), cuyas probabilidades son relativamente fáciles de calcular, tiene valores que se encuentran razonablemente cercanos a las de otra distribución (como la binomial) cuyas probabilidades implican cálculos más complicados.

 

RECOMENDACIONES PRÁCTICAS:

 

 

 

 

 

 

 

La distribución normal: distribución de una variable aleatoria continua.

 

La variable puede tomar cualquier valor que esté en un intervalo de valores dado, y la distribución de probabilidad es continua.

 

Las razones básicas de la importancia de la distribución normal son:

 

  1. Tiene algunas propiedades que la hacen aplicable a un gran número de situaciones en las que es necesario hacer inferencias mediante la toma de muestras. La distribución normal es una útil distribución de muestreo.
  2. La distribución normal casi se ajusta a las distribuciones de frecuencias reales observadas en muchos fenómenos, incluyendo características humanas (pesos, alturas), resultados de procesos físicos (dimensiones y rendimientos) y muchas otras medidas de interés para los administradores.

 

Características de la distribución normal de probabilidad.

 

  1. La curva tiene un solo pico; por tanto, es unimodal. Tiene forma de campana.
  2. La media de una población distribuida normalmente cae en el centro de su curva normal.
  3. Debido a la simetría de la distribución normal de probabilidad, la mediana y la moda se encuentran también en el centro; en consecuencia, para una curva normal, la media, la mediana y la moda tienen el mismo valor.
  4. Los dos extremos de la distribución normal de probabilidad se extienden indefinidamente y nunca tocan el eje horizontal.

 

La mayor parte de las poblaciones reales no se extienden de manera indefinida en ambas direcciones; pero en estas poblaciones, la distribución normal es una aproximación conveniente. No hay una sola distribución normal, sino una familia de curvas normales. Para definir una distribución normal de probabilidad necesitamos definir sólo dos parámetros: la media y la desviación estándar.

 

La curva normal puede describir un gran número de poblaciones, diferenciadas solamente por la media, la desviación estándar o por ambas.

 

Áreas bajo la curva normal.

 

No importa cuáles sean los valores de m y s para una distribución de probabilidad normal, el área bajo la curva es 1,00, de manera que podemos pensar en áreas bajo la curva como si fueran probabilidades. Matemáticamente:

 

  1. Aproximadamente el 68% de todos los valores de una población normalmente distribuida se encuentran dentro + 1 desviación estándar de la media.
  2. Aproximadamente 95,5% de todos los valores de una población normalmente distribuida se encuentran dentro de + 2 desviaciones estándar de la media.
  3. Aproximadamente 99,7% de todos los valores de una población normalmente distribuida se encuentran dentro de + 3 desviaciones estándar de la media.

 

Las tablas estadísticas indican porciones del área bajo la curva normal que están contenidas dentro de cualquier número de desviaciones estándar (más, menos) a partir de la media.

 

No es posible ni necesario tener una tabla distinta para cada curva normal posible. En lugar de ello, podemos utilizar una distribución de probabilidad normal estándar para encontrar áreas bajo cualquier curva normal. Con esta tabla podemos determinar el área o la probabilidad de que la variable aleatoria distribuida normalmente esté dentro de ciertas distancias a partir de la media. Estas distancias están definidas en términos de desviaciones estándar.

Para cualquier distribución normal de probabilidad, todos los intervalos que contienen el mismo número de desviaciones estándar a partir de la media contendrán la misma fracción del área total bajo la curva para cualquier distribución de probabilidad normal.

 

Uso de la tabla de distribución de probabilidad normal estándar.

 

En esta tabla, el valor z está derivado de la fórmula:

 

z = (x - m ) / s

 

en la que:

 

 

¿Por qué utilizamos z en lugar del número de desviaciones estándar? Las variables aleatorias distribuidas normalmente tienen unidades diferentes de medición: dólares, pulgadas, partes de millón, kilogramos, segundos, etc. Como vamos a utilizar una tabla, hablamos en términos de unidades estándar (que en realidad significa desviaciones estándar), y denotamos a éstas con el símbolo z.

 

La tabla de distribución de probabilidad normal estándar da los valores de únicamente la mitad del área bajo la curva normal, empezando con 0,0 en la media. Como la distribución normal de probabilidad es simétrica, los valores verdaderos para una mitad de la curva son verdaderos para la otra.

Defectos de la distribución normal de probabilidad.

 

Los extremos de la distribución normal se acercan al eje horizontal, pero nunca llegan a tocarlo. Esto implica que existe algo de probabilidad (aunque puede ser muy pequeña) de que la variable aleatoria pueda tomar valores demasiado grandes. No perderemos mucha precisión al ignorar valores tan alejados de la media. Pero a cambio de la conveniencia del uso de este modelo teórico, debemos aceptar el hecho de que puede asignar valores empíricos imposibles.

 

La distribución normal como una aproximación de la distribución binomial.

 

Aunque la distribución normal es continua, resulta interesante hacer notar que algunas veces puede utilizarse para aproximar a distribuciones discretas.

 

La aproximación normal a la distribución binomial resulta muy conveniente, pues nos permite resolver el problema sin tener que consultar grandes tablas de la distribución binomial. Pero se necesita tener algo de cuidado al utilizar esta aproximación, que es bastante buena, siempre que np y nq sean al menos de cinco.

 

SUGERENCIA:

 

La distribución normal es otra función algebraica con propiedades matemáticas bien conocidas, y es una buena aproximación para muchos problemas binomiales que impliquen números grandes. Pero, no olvide la regla de que tanto np y nq deben ser de al menos , y sea cauteloso acerca de la aplicación de la aproximación normal a situaciones en las que la probabilidad de un evento es muy pequeña. Los valores de la aproximación normal provenientes de los extremos de la distribución no son muy exactos.

 

Este modelo se aplica generalmente en el caso de variables que presentan las siguientes características:

 

 

Estos elementos son sólo orientativos, y proporcionan un primer indicio para iniciar la búsqueda del modelo más apropiado.

Distribución exponencial.

 

Procesos donde se estudian fenómenos como tiempo entre o distancia entre dos eventos cualquiera, se pueden modelas mediante la distribución exponencial, que tiene la siguiente función de densidad:

 

Image3.jpe (1849 bytes)donde a es el parámetro del modelo. Sus principales propiedades son:

 

 

El parámetro a representa el valor esperado de la variable.

 

La función de distribución es la siguiente:

 

F(X) = 1 - e-x/a

 

Teorema del límite central.

 

Este teorema explica la vinculación que existe entre diversas distribuciones de probabilidad y la normal. Especifica las condiciones bajo las cuales puede esperarse que una variable aleatoria tenga distribución normal.

 

Si sumamos variables aleatorias del mismo tipo, si el número de términos de la suma es suficientemente grande, el resultado que se obtiene es una variable con distribución normal.

 

En la práctica, si todas las variables que sumamos tienen la misma distribución, no es necesario que n sea demasiado grande para que se verifique la normalidad de la suma.

 

Una aplicación inmediata de este teorema es la interpretación de la media aritmética: para calcular un promedio, sumamos variables que provienen de la misma población, y por lo tanto tienen igual distribución. La media obtenida seguramente va a tener distribución normal, aún para valores bajos de n.

 

Otro aspecto importante es la siguiente extensión del teorema: no es estrictamente necesario que todas las variables tengan la misma distribución. Basta con que sean independientes, y tengan esperanza y varianza finitas, para que si n es lo suficientemente grande, el resultado de la suma tenga aproximadamente distribución normal:

 

Y - N (å m , S s 2)

 

Se asume que cada término de la suma aporta un efecto del mismo orden de magnitud, y que es poco probable que un valor individual haga una gran contribución a la suma.

 

Este teorema explica por qué algunos modelos tienden a la normal, bajo ciertas condiciones:

 

Modelo binomial: es la suma de n variables - tipo Bernoulli -, y si n tiende a infinito, las probabilidades se pueden aproximar mediante la normal.

 

Modelo de Poisson: es una extensión de la binomial, y por tanto, se verifica que para l = np suficientemente grande, se pueden aproximar sus probabilidades con la normal.

 

RECOMENDACIONES PRÁCTICAS:

 

P (a<X<b); P (a<X<b); P (a<X<b); P (a<X<b)

 

Identificación del modelo apropiado.

 

La selección depende, entre otros, de los siguientes factores:

 

 

Una vez identificado el modelo apropiado, hay que calcular sus parámetros, en base a las observaciones que se dispongan de la variable en estudio.

 

Si planeamos utilizar una probabilidad para describir una situación, debemos escoger con cuidado la correcta. La distribución binomial se aplica cuando el número de ensayos está fijo antes de que empiece el experimento, y cada ensayo es independiente y puede tener sólo dos resultados mutuamente excluyentes. Al igual que la distribución binomial, se aplica cuando cada ensayo es independiente de los demás. Pero, aunque la probabilidad de Poisson se aproxima a cero después de los primeros valores, el número de valores posibles es infinito. No se conoce el límite de dos resultados mutuamente excluyentes. En ciertas condiciones, la distribución de Poisson se puede utilizar como aproximación de la binomial, pero no siempre es posible hacerlo. Todas las suposiciones que conforman la base de una distribución deben cumplirse, si la intención del uso de dicha distribución es producir resultados significativos.

 

Conceptos.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

REGRESAR