La distribución binomial es una de las distribuciones de probabilidad discretas más fundamentales y utilizadas en estadística.
Es un modelo matemático que describe la probabilidad de obtener un número específico de éxitos en una secuencia fija de ensayos independientes, donde cada ensayo tiene solo dos resultados posibles: éxito o fracaso.
En este artículo, exploraremos en detalle la distribución binomial, desde sus características y parámetros hasta su cálculo de probabilidades y su aproximación a la distribución normal. Comprender este modelo es crucial para analizar y predecir eventos en una amplia variedad de campos, desde la biología y la medicina hasta las finanzas y el marketing.
Características y Parámetros
La distribución binomial se define por las siguientes características clave:
1. Número Fijo de Ensayos (n): El experimento consta de un número predeterminado de ensayos. Cada ensayo es independiente de los demás.
2. Independencia: El resultado de cada ensayo no influye en el resultado de los demás.
3. Dos Resultados Posibles: Cada ensayo tiene solo dos resultados posibles, convencionalmente denominados éxito y fracaso.
4. Probabilidad Constante de Éxito (p): La probabilidad de éxito (p) es la misma para cada ensayo.
Parámetros:</strong La distribución binomial se define por dos parámetros:
- n: El número de ensayos.
- p: La probabilidad de éxito en cada ensayo.
La notación común para una variable aleatoria X que sigue una distribución binomial es X ~ B(n, p).
Cálculo de Probabilidades
La probabilidad de obtener exactamente k éxitos en n ensayos en una distribución binomial se calcula mediante la siguiente fórmula:
P(X = k) = (n choose k) * p^k * (1 - p)^(n - k)
Donde:
P(X = k)
es la probabilidad de obtener exactamente k éxitos.(n choose k)
es el coeficiente binomial, que representa el número de formas de elegir k éxitos de n ensayos. Se calcula como:
(n choose k) = n! / (k! * (n - k)!)
Donde ‘!’ denota el factorial de un número.
p
es la probabilidad de éxito en un solo ensayo.(1 - p)
es la probabilidad de fracaso en un solo ensayo.
Ejemplo:
Supongamos que lanzamos una moneda justa 10 veces (n = 10) y queremos calcular la probabilidad de obtener exactamente 6 caras (k = 6). La probabilidad de obtener cara en un solo lanzamiento es p = 0.5.
P(X = 6) = (10 choose 6) * 0.5^6 * 0.5^(10 - 6)
Calculando el coeficiente binomial:
(10 choose 6) = 10! / (6! * 4!) = (10 * 9 * 8 * 7) / (4 * 3 * 2 * 1) = 210
Por lo tanto:
P(X = 6) = 210 * 0.5^6 * 0.5^4 = 210 * 0.015625 * 0.0625 = 0.205078125
Entonces, la probabilidad de obtener exactamente 6 caras en 10 lanzamientos de una moneda justa es aproximadamente 0.205.
Aproximación Normal
Cuando el número de ensayos (n) es suficientemente grande y la probabilidad de éxito (p) no está demasiado cerca de 0 o 1, la distribución binomial puede aproximarse mediante una distribución normal con la misma media y varianza.
Esta aproximación es útil porque la distribución normal es continua y tiene propiedades bien conocidas, lo que facilita el cálculo de probabilidades, especialmente cuando n es grande y el cálculo directo de las probabilidades binomiales se vuelve computacionalmente costoso.
Condiciones para la Aproximación Normal:
Una regla general es que la aproximación normal es razonable si se cumplen las siguientes condiciones:
np >= 5
n(1 - p) >= 5
Media y Varianza de la Aproximación Normal:
Si X ~ B(n, p), entonces la media (μ) y la varianza (σ^2) de la distribución binomial son:
- Media:
μ = np
- Varianza:
σ^2 = np(1 - p)
- Desviación Estándar:
σ = sqrt(np(1 - p))
Corrección por Continuidad:
Dado que la distribución binomial es discreta y la distribución normal es continua, a menudo se aplica una corrección por continuidad al usar la aproximación normal. Esto implica sumar o restar 0.5 al valor discreto al calcular la probabilidad.
Por ejemplo, para aproximar P(X <= k) usando la distribución normal, se calcula P(X <= k + 0.5).
Ejemplo:
Supongamos que lanzamos una moneda justa 100 veces (n = 100) y queremos aproximar la probabilidad de obtener 55 o menos caras (X <= 55). La probabilidad de obtener cara en un solo lanzamiento es p = 0.5.
Primero, verificamos las condiciones para la aproximación normal:
np = 100 * 0.5 = 50 >= 5
n(1 - p) = 100 * 0.5 = 50 >= 5
Las condiciones se cumplen, por lo que podemos usar la aproximación normal.
Calculamos la media y la desviación estándar:
μ = np = 50
σ = sqrt(np(1 - p)) = sqrt(100 * 0.5 * 0.5) = sqrt(25) = 5
Aplicando la corrección por continuidad, queremos calcular P(X <= 55.5) usando la distribución normal.
Estandarizamos el valor:
z = (55.5 - 50) / 5 = 5.5 / 5 = 1.1
Consultamos una tabla de la distribución normal estándar o utilizamos un software estadístico para encontrar P(Z <= 1.1), que es aproximadamente 0.8643.
Por lo tanto, la probabilidad aproximada de obtener 55 o menos caras en 100 lanzamientos de una moneda justa es aproximadamente 0.8643.
En resumen, la distribución binomial es una herramienta esencial para modelar situaciones donde hay una serie de ensayos independientes con dos resultados posibles. Hemos explorado sus características, el cálculo de probabilidades y su aproximación a la distribución normal. Comprender este modelo permite analizar y predecir eventos en diversas disciplinas.
Su capacidad para modelar éxitos y fracasos la convierte en una herramienta valiosa en la toma de decisiones y el análisis de datos.