1 왜 연속 분포인가
이산 분포가 셀 수 있는 결과를 모델링한다면, 연속 분포는 측정값·길이·시간·비율처럼 실수 직선(또는 그 일부) 위에 놓이는 현상을 모델링한다. 연속 분포에서 확률은 밀도 함수(PDF)의 적분으로 주어진다:
\[ P(a \le X \le b) = \int_a^b f_X(x) \, dx \]
이산 분포에서는 각 값의 확률을 더한다. 연속 분포에서는 단일 점의 확률이 0이므로(구간의 길이가 0이기 때문), “더한다”는 개념이 적분으로 바뀐다.
\(f_X(x)\) 를 “밀도”라고 부르는 이유가 여기 있다 — 밀도는 얼마나 확률이 그 근방에 밀집해 있는지를 나타낸다. 아주 좁은 구간 \([x, x+dx]\) 의 확률은 \(f_X(x) \cdot dx\) 로 근사된다. 이 작은 직사각형들을 모두 더하면(적분하면) 전체 확률이 된다.
반사실: 만약 모든 점에 양수 확률을 부여하면 비가산 무한 개의 양수를 더해야 하므로 합이 무한대가 된다. 따라서 연속 분포에서는 개별 점 대신 구간에 대한 확률만 의미를 갖는다.
아래 표는 이 포스트에서 다루는 핵심 연속 분포를 한눈에 정리한다.
| 분포 | 표기 | 지지 집합 | 핵심 역할 |
|---|---|---|---|
| 연속균등 | \(\text{Uniform}(a,b)\) | \([a,b]\) | 무정보 사전분포, PIT, 난수 생성 기반 |
| 정규 | \(N(\mu, \sigma^2)\) | \((-\infty, \infty)\) | CLT 극한 분포, 오차 모델링의 표준 |
| 감마 | \(\text{Gamma}(\alpha, \beta)\) | \((0, \infty)\) | 대기시간, 적률, 베이지안 켤레 사전분포 |
| 지수 | \(\text{Exp}(\beta)\) | \((0, \infty)\) | 감마의 특수 케이스(\(\alpha=1\)), 무기억성 |
| 카이제곱 | \(\chi^2(\nu)\) | \((0, \infty)\) | 감마의 특수 케이스, 검정 통계량 분포 |
| 베타 | \(\text{Beta}(\alpha, \beta)\) | \((0, 1)\) | 비율 모델링, 베이지안 이항 켤레 사전분포 |
| 코시 | \(\text{Cauchy}(\theta, \sigma)\) | \((-\infty, \infty)\) | 중꼬리 분포, 평균·분산 미존재 |
| 로그정규 | \(\text{LogNormal}(\mu, \sigma^2)\) | \((0, \infty)\) | 소득·주가·생물학적 측정 |
2 정규 분포 (Normal Distribution)
2.1 정의
\(X \sim N(\mu, \sigma^2)\) 이면 PDF는:
\[ f_X(x \mid \mu, \sigma^2) = \frac{1}{\sqrt{2\pi}\,\sigma} \exp\!\left(-\frac{(x-\mu)^2}{2\sigma^2}\right), \quad x \in \mathbb{R} \]
\[\frac{1}{\sqrt{2\pi}\,\sigma} \cdot \exp\!\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)\]
- \(\exp(-\cdots)\) 항: 지수 함수의 인수가 음수이므로, 중심에서 멀어질수록 밀도가 급격히 0에 가까워진다. \((x-\mu)^2\) 이 이차식이므로 감소 속도는 거리의 제곱에 비례한다 — 이것이 종 모양 대칭 곡선의 원인이다.
- \((x-\mu)^2\): 제곱 덕분에 양쪽 방향으로 동일하게 감소한다. 만약 \(|x-\mu|\) 처럼 절댓값을 썼다면 라플라스 분포(뾰족한 봉우리)가 된다.
- \(2\sigma^2\) 분모: \(\sigma\) 가 클수록 지수 인수가 천천히 감소 → 곡선이 옆으로 넓게 퍼진다. \(\sigma\) 가 작을수록 급격히 감소 → 날카로운 봉우리가 된다.
- \(1/(\sqrt{2\pi}\sigma)\): 전체 면적이 1이 되도록 정규화하는 상수이다. \(\sqrt{2\pi}\) 는 가우시안 적분 \(\int e^{-z^2/2}dz = \sqrt{2\pi}\) 에서 나온다.
- \(\mu \in \mathbb{R}\): 위치 모수 (평균)
- \(\sigma^2 > 0\): 척도 모수 (분산)
표준 정규: \(Z \sim N(0,1)\), PDF를 \(\phi(z)\), CDF를 \(\Phi(z)\)로 표기한다.
2.2 성질
| 성질 | 값 |
|---|---|
| 평균 \(E[X]\) | \(\mu\) |
| 분산 \(\text{Var}(X)\) | \(\sigma^2\) |
| MGF \(M_X(t)\) | \(\exp(\mu t + \sigma^2 t^2/2)\) |
| 중위수 = 최빈값 | \(\mu\) |
| 지수족 여부 | O |
| 위치-척도족 여부 | O |
정규화 상수 \(\sqrt{2\pi}\)의 유도: 가우시안 적분 \(\int_{-\infty}^\infty e^{-x^2/2} dx = \sqrt{2\pi}\) 를 이용한다 (Casella & Berger, 2002, Ch.3).
2.3 선형 변환 닫힘성
\(X \sim N(\mu, \sigma^2)\) 이면:
\[ aX + b \sim N(a\mu + b,\ a^2\sigma^2) \]
독립 정규 합: \(X_i \sim N(\mu_i, \sigma_i^2)\) 독립이면 \(\sum X_i \sim N(\sum \mu_i, \sum \sigma_i^2)\).
2.4 표준화와 CDF
\[ Z = \frac{X - \mu}{\sigma} \sim N(0,1), \quad P(X \le x) = \Phi\!\left(\frac{x-\mu}{\sigma}\right) \]
\(\Phi\)는 닫힌 형식이 없어 수치적으로 계산하거나 표를 이용한다.
2.5 68-95-99.7 규칙
\[ P(\mu - k\sigma \le X \le \mu + k\sigma) \approx \begin{cases} 0.6827 & k=1 \\ 0.9545 & k=2 \\ 0.9973 & k=3 \end{cases} \]
2.6 왜 정규 분포인가
중심극한정리(CLT)에 따르면, 유한 분산을 갖는 iid 확률변수의 표준화 합은 정규 분포로 수렴한다:
\[ \frac{\bar{X}_n - \mu}{\sigma/\sqrt{n}} \xrightarrow{d} N(0,1) \quad (n \to \infty) \]
따라서 정규 분포는 특정 현상의 분포가 아니라 반복 측정의 극한 거동을 기술하는 도구이다.
3 감마 분포 (Gamma Distribution)
3.1 감마 함수
감마 분포의 정규화 상수는 감마 함수(Gamma function)에 기반한다:
\[ \Gamma(\alpha) = \int_0^\infty t^{\alpha-1} e^{-t} \, dt, \quad \alpha > 0 \]
핵심 성질: - \(\Gamma(\alpha+1) = \alpha \, \Gamma(\alpha)\) (재귀 관계) - \(\Gamma(n) = (n-1)!\) (\(n\) 양의 정수) - \(\Gamma(1/2) = \sqrt{\pi}\)
3.2 정의
\(X \sim \text{Gamma}(\alpha, \beta)\) 이면 PDF는:
\[ f_X(x \mid \alpha, \beta) = \frac{1}{\Gamma(\alpha)\,\beta^\alpha} x^{\alpha-1} e^{-x/\beta}, \quad x > 0 \]
\[\frac{1}{\Gamma(\alpha)\beta^\alpha} \cdot x^{\alpha-1} \cdot e^{-x/\beta}\]
- \(x^{\alpha-1}\) 항 (형상 모수 \(\alpha\)): \(\alpha > 1\) 이면 \(x=0\) 에서 밀도가 0이고 내부에서 봉우리가 생긴다. \(\alpha = 1\) 이면 \(x^0 = 1\) 이므로 단조감소하는 지수 분포가 된다. \(\alpha\) 가 클수록 분포가 오른쪽으로 이동하고 더 대칭적인 모양이 된다.
- \(e^{-x/\beta}\) 항 (척도 모수 \(\beta\)): \(x\) 가 커질수록 밀도를 0으로 당기는 감쇠 항이다. \(\beta\) 가 클수록 감쇠가 느려져 분포가 오른쪽으로 늘어진다.
- 두 항의 경쟁: \(x^{\alpha-1}\) 은 \(x\) 가 커질수록 증가하고, \(e^{-x/\beta}\) 는 감소한다. 이 두 힘의 균형 지점이 최빈값 \((\alpha-1)\beta\) 이다.
- 포아송 과정에서 \(k\)번째 이벤트까지의 대기 시간이 \(\text{Gamma}(k, 1/\lambda)\) 를 따르는 이유는, \(k\) 번의 지수 분포 대기를 합산한 결과이기 때문이다.
- \(\alpha > 0\): 형상 모수(shape parameter)
- \(\beta > 0\): 척도 모수(scale parameter)
주의: 일부 교재·소프트웨어는 rate parameter \(\lambda = 1/\beta\)를 사용한다. 문맥을 확인한다.
3.3 성질
| 성질 | 값 |
|---|---|
| 평균 \(E[X]\) | \(\alpha\beta\) |
| 분산 \(\text{Var}(X)\) | \(\alpha\beta^2\) |
| MGF \(M_X(t)\) | \((1 - \beta t)^{-\alpha}\), \(t < 1/\beta\) |
| 지수족 여부 | O |
감마의 닫힘성(Closure): 독립 \(X_i \sim \text{Gamma}(\alpha_i, \beta)\)이면 \(\sum X_i \sim \text{Gamma}(\sum \alpha_i, \beta)\).
3.4 특수 케이스
지수 분포 (Exponential Distribution)
\[ X \sim \text{Exp}(\beta) \iff X \sim \text{Gamma}(1, \beta) \]
\[ f_X(x) = \frac{1}{\beta} e^{-x/\beta}, \quad x > 0 \]
- \(E[X] = \beta\), \(\text{Var}(X) = \beta^2\)
- 무기억성: \(P(X > s+t \mid X > s) = P(X > t)\) — 지수 분포의 고유 성질
- 연속 분포 중 무기억성을 갖는 유일한 분포이다
- 응용: 고장 시간, 대기 시간 모델링
카이제곱 분포 (Chi-squared Distribution)
\[ X \sim \chi^2(\nu) \iff X \sim \text{Gamma}(\nu/2,\ 2) \]
\[ f_X(x) = \frac{1}{2^{\nu/2}\,\Gamma(\nu/2)} x^{\nu/2-1} e^{-x/2}, \quad x > 0 \]
- \(\nu\): 자유도 (degrees of freedom)
- \(E[X] = \nu\), \(\text{Var}(X) = 2\nu\)
- 독립 표준정규 합의 제곱: \(Z_1, \ldots, Z_\nu \sim N(0,1)\) 독립이면 \(\sum Z_i^2 \sim \chi^2(\nu)\)
- 응용: 적합도 검정, 분산 추정, 신뢰구간
\[ \text{Gamma}(\alpha, \beta) \begin{cases} \alpha = 1 \Rightarrow \text{Exp}(\beta) \\ \alpha = \nu/2,\ \beta = 2 \Rightarrow \chi^2(\nu) \end{cases} \]
포아송 과정에서 \(k\)번째 사건까지의 대기 시간 \(\sim \text{Gamma}(k, 1/\lambda)\) (rate \(\lambda\)).
4 베타 분포 (Beta Distribution)
4.1 베타 함수
\[ B(\alpha, \beta) = \int_0^1 t^{\alpha-1}(1-t)^{\beta-1} \, dt = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)} \]
4.2 정의
\(X \sim \text{Beta}(\alpha, \beta)\) 이면 PDF는:
\[ f_X(x \mid \alpha, \beta) = \frac{1}{B(\alpha,\beta)} x^{\alpha-1}(1-x)^{\beta-1}, \quad x \in (0,1) \]
\[\frac{1}{B(\alpha,\beta)} \cdot x^{\alpha-1} \cdot (1-x)^{\beta-1}\]
- \(x^{\alpha-1}\) 항: \(x=0\) 근방의 밀도를 결정한다. \(\alpha > 1\) 이면 \(x=0\) 에서 밀도가 0 (0을 기피), \(\alpha < 1\) 이면 0 근방에서 밀도가 폭발적으로 증가 (0을 선호), \(\alpha = 1\) 이면 중립.
- \((1-x)^{\beta-1}\) 항: 같은 방식으로 \(x=1\) 근방의 밀도를 결정한다. \(\beta\) 가 클수록 1 근방을 기피한다.
- 대칭성: \(\alpha = \beta\) 이면 두 항이 대칭이므로 분포가 0.5를 중심으로 대칭이다. \(\alpha > \beta\) 이면 오른쪽에 더 높은 밀도 (높은 값 선호), \(\alpha < \beta\) 이면 왼쪽에 더 높은 밀도.
- 베이지안 해석: 성공률 \(p\) 에 대한 사전 정보가 없을 때 \(\text{Beta}(1,1) = \text{Uniform}(0,1)\) 을 쓴다. \(n\) 번 시행에서 \(s\) 번 성공한 후 사후 분포는 \(\text{Beta}(1+s, 1+n-s)\) 가 된다 — \(\alpha\) 는 “관찰된 성공 수 + 1”, \(\beta\) 는 “관찰된 실패 수 + 1”로 해석된다.
- \(\alpha, \beta > 0\): 형상 모수
4.3 성질
| 성질 | 값 |
|---|---|
| 평균 \(E[X]\) | \(\dfrac{\alpha}{\alpha+\beta}\) |
| 분산 \(\text{Var}(X)\) | \(\dfrac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}\) |
| MGF | 닫힌 형식 없음 (초기하급수) |
| 지수족 여부 | O |
4.4 형상 모수에 따른 형태
| \(\alpha\), \(\beta\) 관계 | 분포 형태 |
|---|---|
| \(\alpha = \beta = 1\) | 균등 분포 \(\text{Uniform}(0,1)\) |
| \(\alpha = \beta > 1\) | 대칭 종 모양 |
| \(\alpha > \beta\) | 오른쪽 치우침 (우편향) |
| \(\alpha < \beta\) | 왼쪽 치우침 (좌편향) |
| \(\alpha, \beta < 1\) | U자형 |
4.5 왜 베타 분포인가
비율(proportion), 확률, 순서통계량 등 \((0,1)\) 구간의 값을 모델링하는 데 자연스러운 분포이다.
- 베이지안 이항 켤레 사전분포: 이항 가능도에 베타 사전분포를 쓰면 사후분포도 베타이다
- 균등 분포의 일반화: \(\text{Beta}(1,1) = \text{Uniform}(0,1)\)
- 균등 분포의 순서통계량: \(X_{(k)} \sim \text{Beta}(k, n-k+1)\)
5 코시 분포 (Cauchy Distribution)
5.1 정의
\(X \sim \text{Cauchy}(\theta, \sigma)\) 이면 PDF는:
\[ f_X(x \mid \theta, \sigma) = \frac{1}{\pi\sigma\left[1 + \left(\frac{x-\theta}{\sigma}\right)^2\right]}, \quad x \in \mathbb{R} \]
코시 PDF의 분모는 \(1 + \left(\frac{x-\theta}{\sigma}\right)^2\) 이다. 이것은 \(|x|\) 가 커질수록 \(x^2\) 에 비례해서 커진다 — 밀도가 \(1/x^2\) 속도로 감소한다는 뜻이다.
반면 정규 분포는 \(e^{-x^2/2}\) 속도로 감소하는데, 지수 함수가 다항 함수보다 훨씬 빠르게 감소한다. 따라서 코시 분포의 꼬리는 정규 분포보다 훨씬 두껍다.
꼬리가 두꺼우면 왜 평균이 없는가: 평균을 계산하려면 \(\int |x| f(x) dx\) 가 유한해야 한다. 코시의 경우 \(\int |x| \cdot \frac{1}{1+x^2} dx \sim \int \frac{|x|}{x^2} dx = \int \frac{1}{|x|} dx\) 인데, 이 적분은 발산한다. \(1/x^2\) 감소가 \(|x|\) 증가를 상쇄하기에 충분하지 않기 때문이다.
직관적 비유: 코시 분포를 따르는 값의 평균을 아무리 많은 표본으로 추정해도, 표본 평균은 수렴하지 않는다. 극단적 이상치가 너무 자주 나타나 표본 평균을 계속 끌어당기기 때문이다.
- \(\theta \in \mathbb{R}\): 위치 모수 (중위수이자 최빈값)
- \(\sigma > 0\): 척도 모수
5.2 특이성: 평균과 분산이 존재하지 않는다
코시 분포는 꼬리가 매우 두꺼워 \(\int |x| f(x) dx = \infty\) 이므로 \(E[X]\)가 존재하지 않는다.
\[ E[|X|] = \infty \Rightarrow E[X] \text{ 미존재} \]
따라서 분산과 MGF도 존재하지 않는다. 중꼬리(heavy-tail) 분포의 대표적 예이다.
표준 코시: \(Z = X/Y\) (\(X, Y \sim N(0,1)\) 독립) \(\sim \text{Cauchy}(0,1)\).
표준 코시는 자유도 1인 \(t\) 분포와 동일하다: \(\text{Cauchy}(0,1) = t(1)\).
5.3 왜 코시 분포인가
- 중심극한정리가 적용되지 않는 반례 — iid 코시 표본 평균도 코시 분포를 따른다
- 로버스트 회귀, 신호처리에서 이상치(outlier)가 많은 오차 모형으로 사용된다
- 물리학에서 공명(resonance) 현상의 선폭(line width) 모형 (로렌츠 분포)
6 로그정규 분포 (Log-normal Distribution)
6.1 정의
\(X > 0\) 이고 \(\log X \sim N(\mu, \sigma^2)\) 이면 \(X \sim \text{LogNormal}(\mu, \sigma^2)\):
\[ f_X(x \mid \mu, \sigma^2) = \frac{1}{x\sqrt{2\pi}\,\sigma} \exp\!\left(-\frac{(\log x - \mu)^2}{2\sigma^2}\right), \quad x > 0 \]
로그정규 분포의 PDF는 정규 분포의 PDF에서 변수 변환 \(x \to \log x\) 를 적용한 결과이다.
\[f_X(x) = f_Z(\log x) \cdot \left|\frac{d(\log x)}{dx}\right| = \phi\!\left(\frac{\log x - \mu}{\sigma}\right) \cdot \frac{1}{x\sigma}\]
- \(1/x\) 항: 변수 변환의 야코비안이다. \(x\) 가 작을수록 \(\log x\) 의 변화율이 크므로(도함수 \(1/x\) 가 크다), 작은 \(x\) 근방에 더 많은 확률 질량이 밀집된다.
- \(\exp(-(\log x - \mu)^2/...)\) 항: 로그 척도에서 정규 분포의 종 모양을 만든다.
- 항상 오른쪽 치우침: 로그 변환의 비대칭성 때문에 선형 척도에서는 항상 긴 오른쪽 꼬리가 생긴다. 평균 \(e^{\mu+\sigma^2/2} >\) 중위수 \(e^\mu >\) 최빈값 \(e^{\mu-\sigma^2}\) 순서가 항상 성립한다.
직관적 비유: 소득, 주가, 세균 수처럼 “더하기”가 아니라 “곱하기”로 성장하는 현상이 로그정규를 따른다. 소득이 매년 5%~20% 성장(곱셈적)하면, 수십 년 후 소득의 로그 값은 정규 분포에 가까워진다(CLT의 곱셈 버전).
6.2 성질
| 성질 | 값 |
|---|---|
| 평균 \(E[X]\) | \(e^{\mu + \sigma^2/2}\) |
| 분산 \(\text{Var}(X)\) | \((e^{\sigma^2}-1)\,e^{2\mu+\sigma^2}\) |
| 중위수 | \(e^\mu\) |
| 최빈값 | \(e^{\mu - \sigma^2}\) |
평균 \(>\) 중위수 \(>\) 최빈값 — 항상 오른쪽 치우침이다.
6.3 왜 로그정규 분포인가
로그를 취하면 정규가 되는 현상에 등장한다:
- 소득 분포, 주가 수익률 (곱셈적 성장)
- 생물학적 측정 (세포 크기, 박테리아 수)
- 생존 분석에서 생존 시간
정규 분포가 덧셈의 극한이라면, 로그정규 분포는 곱셈의 극한이다.
7 이중지수 분포 / 라플라스 분포 (Laplace Distribution)
::: {.callout-note} ## 정의: 라플라스 분포
\(X \sim \text{Laplace}(\mu, b)\) 이면:
\[ f_X(x) = \frac{1}{2b} \exp\!\left(-\frac{|x - \mu|}{b}\right), \quad x \in \mathbb{R} \]
라플라스 PDF의 핵심은 지수 함수의 인수에 \(|x - \mu|\) (절댓값)가 들어간다는 점이다.
- 정규 분포는 \((x-\mu)^2\) (이차식) 을 사용 → 봉우리 근방에서 완만하게 감소 (이차 곡선처럼 매끄러운 산 모양)
- 라플라스 분포는 \(|x-\mu|\) (일차 절댓값) 을 사용 → \(x = \mu\) 에서 날카로운 꺾임 발생, 봉우리가 뾰족함
- 라플라스는 정규보다 중심에 더 집중되어 있고(뾰족), 동시에 꼬리도 더 두꺼워서 이상치가 더 자주 나온다.
Lasso 회귀와의 연결: Lasso의 L1 페널티 \(\lambda \sum |\beta_j|\) 는 회귀 계수 \(\beta\) 에 라플라스 사전분포를 부여하는 것과 동일하다. \(|x-0|\) 형태의 라플라스 분포는 0에서 날카로운 봉우리를 가지므로, MAP 추정이 많은 계수를 정확히 0으로 추정하도록(희소성) 유도한다.
- \(E[X] = \mu\), \(\text{Var}(X) = 2b^2\)
- 정규보다 뾰족하고 꼬리가 두꺼운 레프토커틱(leptokurtic) 분포
- Lasso 회귀(L1 페널티)는 라플라스 사전분포를 MAP 추정으로 해석할 수 있다
8 연속 분포 상호 관계
Uniform(0,1)
│
├─ PIT: 모든 연속 분포로 변환 가능
│
└─ Beta(1,1) = Uniform(0,1)
Normal(μ, σ²)
│
├─ exp(Normal) = LogNormal
├─ Z² = Chi²(1) ──┐
└─ Z₁/Z₂ = Cauchy(0,1) │
↓
Gamma(α, β) Chi²(ν) = Gamma(ν/2, 2)
│ │
└─ α=1: Exp(β) └─ 표준정규 ν개의 제곱합
Beta(α, β)
└─ 균등의 순서통계량 X_(k) ~ Beta(k, n-k+1)
| 변환 관계 | 설명 |
|---|---|
| \(Z \sim N(0,1) \Rightarrow Z^2 \sim \chi^2(1)\) | 카이제곱은 표준정규의 제곱 |
| \(\sum_{i=1}^\nu Z_i^2 \sim \chi^2(\nu)\) | 카이제곱의 닫힘성 |
| \(X \sim N, Y \sim \chi^2(\nu) \Rightarrow \frac{X}{\sqrt{Y/\nu}} \sim t(\nu)\) | \(t\) 분포 생성 |
| \(\frac{\chi^2(m)/m}{\chi^2(n)/n} \sim F(m,n)\) | \(F\) 분포 생성 |
| \(\log X \sim N \Rightarrow X \sim \text{LogNormal}\) | 로그-정규 연결 |
| \(\text{Beta}(1,1) = \text{Uniform}(0,1)\) | 베타의 특수 케이스 |
| \(\text{Gamma}(1,\beta) = \text{Exp}(\beta)\) | 감마의 특수 케이스 |
9 분포별 성질 요약 테이블
| 분포 | 평균 | 분산 | MGF 존재 | 지지 | 지수족 |
|---|---|---|---|---|---|
| \(N(\mu,\sigma^2)\) | \(\mu\) | \(\sigma^2\) | O | \(\mathbb{R}\) | O |
| \(\text{Gamma}(\alpha,\beta)\) | \(\alpha\beta\) | \(\alpha\beta^2\) | O (\(t<1/\beta\)) | \((0,\infty)\) | O |
| \(\text{Exp}(\beta)\) | \(\beta\) | \(\beta^2\) | O (\(t<1/\beta\)) | \((0,\infty)\) | O |
| \(\chi^2(\nu)\) | \(\nu\) | \(2\nu\) | O (\(t<1/2\)) | \((0,\infty)\) | O |
| \(\text{Beta}(\alpha,\beta)\) | \(\frac{\alpha}{\alpha+\beta}\) | \(\frac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}\) | O (급수) | \((0,1)\) | O |
| \(\text{Cauchy}(\theta,\sigma)\) | 미존재 | 미존재 | X | \(\mathbb{R}\) | X |
| \(\text{LogNormal}(\mu,\sigma^2)\) | \(e^{\mu+\sigma^2/2}\) | \((e^{\sigma^2}-1)e^{2\mu+\sigma^2}\) | X | \((0,\infty)\) | X |
| \(\text{Laplace}(\mu,b)\) | \(\mu\) | \(2b^2\) | O (\(|t|<1/b\)) | \(\mathbb{R}\) | O |
10 코드 예시
10.1 Step 1: 순수 Python — PDF 직접 구현
import math
# 정규 분포 PDF
def normal_pdf(x, mu=0, sigma=1):
return (1 / (math.sqrt(2 * math.pi) * sigma)) * math.exp(-0.5 * ((x - mu) / sigma) ** 2)
# 감마 분포 PDF (shape=alpha, scale=beta)
def gamma_pdf(x, alpha, beta):
if x <= 0:
return 0.0
return (x ** (alpha - 1) * math.exp(-x / beta)) / (math.gamma(alpha) * beta ** alpha)
# 지수 분포 PDF — Gamma(1, beta)
def exp_pdf(x, beta):
return gamma_pdf(x, alpha=1, beta=beta)
# 베타 분포 PDF
def beta_func(a, b):
return math.gamma(a) * math.gamma(b) / math.gamma(a + b)
def beta_pdf(x, alpha, beta):
if not 0 < x < 1:
return 0.0
return x ** (alpha - 1) * (1 - x) ** (beta - 1) / beta_func(alpha, beta)
# 검증: 각 PDF의 대표값 계산
print("=== 정규 분포 N(0,1) ===")
print(f"f(0) = {normal_pdf(0):.6f} (이론: {1/math.sqrt(2*math.pi):.6f})")
print("\n=== 감마 분포 Gamma(2, 3) ===")
x = 3.0 # 평균 = alpha*beta = 6
print(f"f(3) = {gamma_pdf(3, alpha=2, beta=3):.6f}")
print(f"E[X] = {2*3} (alpha*beta)")
print("\n=== 지수 분포 Exp(2) ===")
print(f"f(1) = {exp_pdf(1, beta=2):.6f} (이론: {(1/2)*math.exp(-1/2):.6f})")
print(f"무기억성 P(X>3|X>1) = P(X>2): {math.exp(-2/2):.6f}")
print("\n=== 베타 분포 Beta(2,5) ===")
print(f"f(0.2) = {beta_pdf(0.2, alpha=2, beta=5):.6f}")
print(f"E[X] = {2/(2+5):.4f} (이론: alpha/(alpha+beta))")10.2 Step 2: scipy.stats — 연속 분포 비교
import numpy as np
from scipy import stats
# 각 분포 객체 생성
distributions = {
"Normal(0,1)": stats.norm(loc=0, scale=1),
"Gamma(2,3)": stats.gamma(a=2, scale=3),
"Exp(2)": stats.expon(scale=2),
"Chi2(5)": stats.chi2(df=5),
"Beta(2,5)": stats.beta(a=2, b=5),
"LogNormal(0,0.5)": stats.lognorm(s=0.5, scale=np.exp(0)),
"Cauchy(0,1)": stats.cauchy(loc=0, scale=1),
}
print(f"{'분포':<22} {'Mean':>10} {'Var':>12} {'Median':>10}")
print("-" * 58)
for name, dist in distributions.items():
try:
mean = dist.mean()
var = dist.var()
med = dist.median()
print(f"{name:<22} {mean:>10.4f} {var:>12.4f} {med:>10.4f}")
except Exception:
print(f"{name:<22} {'N/A':>10} {'N/A':>12} {'N/A':>10}")분포 Mean Var Median
----------------------------------------------------------
Normal(0,1) 0.0000 1.0000 0.0000
Gamma(2,3) 6.0000 18.0000 5.3063
Exp(2) 2.0000 4.0000 1.3863
Chi2(5) 5.0000 10.0000 4.3515
Beta(2,5) 0.2857 0.0255 0.2633
LogNormal(0,0.5) 1.1331 0.3524 1.0000
Cauchy(0,1) N/A N/A 0.0000
10.3 Step 3: 분포 선택 가이드 — 데이터 유형별
import numpy as np
from scipy import stats
# 시나리오 1: 양수 대기 시간 데이터 → 감마/지수 적합
np.random.seed(42)
wait_times = np.random.exponential(scale=5, size=200) # 평균 5분 대기
# 지수 분포 적합
scale_hat = wait_times.mean() # MLE: beta = x_bar
ks_stat, p_value = stats.kstest(wait_times, 'expon', args=(0, scale_hat))
print(f"=== 대기 시간 → 지수 분포 적합 ===")
print(f"MLE scale = {scale_hat:.3f} (참: 5.0)")
print(f"KS test p-value = {p_value:.4f} ({'적합' if p_value > 0.05 else '부적합'})")
# 시나리오 2: 비율 데이터 → 베타 적합
click_rates = np.random.beta(a=2, b=8, size=200) # 전환율 ~ Beta(2,8)
alpha_hat, beta_hat, _, _ = stats.beta.fit(click_rates, floc=0, fscale=1)
print(f"\n=== 전환율 → 베타 분포 적합 ===")
print(f"MLE alpha = {alpha_hat:.3f} (참: 2.0), beta = {beta_hat:.3f} (참: 8.0)")
print(f"E[X] = {alpha_hat/(alpha_hat+beta_hat):.4f} (참: {2/(2+8):.4f})")
# 시나리오 3: 양수 데이터가 곱셈적 구조 → 로그정규
incomes = np.random.lognormal(mean=10.5, sigma=0.8, size=500)
mu_hat = np.log(incomes).mean()
sigma_hat = np.log(incomes).std()
print(f"\n=== 소득 데이터 → 로그정규 적합 ===")
print(f"MLE mu = {mu_hat:.3f} (참: 10.5), sigma = {sigma_hat:.3f} (참: 0.8)")
print(f"중위수 = {np.exp(mu_hat):.1f}, 평균 = {np.exp(mu_hat + sigma_hat**2/2):.1f}")11 분포 선택 지침
어떤 연속 분포를 선택할지는 데이터의 지지 집합과 형태에 따라 결정된다:
| 데이터 특성 | 후보 분포 | 이유 |
|---|---|---|
| \((-\infty, \infty)\), 대칭, 가벼운 꼬리 | Normal | CLT, 오차 모델 |
| \((-\infty, \infty)\), 대칭, 무거운 꼬리 | Cauchy, \(t(\nu)\) | 이상치 내성 |
| \((0, \infty)\), 양의 치우침 | Gamma, LogNormal | 대기시간, 소득 |
| \((0, \infty)\), 무기억성 | Exponential | 포아송 과정 간격 |
| \((0, 1)\), 비율·확률 | Beta | 이항 켤레 |
| 검정 통계량 | \(\chi^2\), \(t\), \(F\) | 표본 분포 이론 |
12 관련 주제
선행 지식
- 분포 가족 개요 — 이산·연속 분포, 지수족, 위치-척도족
- 이산 분포 — 이산균등, 초기하, 이항, 포아송, 음이항, 기하
- 연속균등 분포 (Continuous Uniform Distribution)
후속 주제 (개별 포스트)
- 정규 분포 (Normal Distribution)
- 감마·지수·카이제곱 분포 (Gamma, Exponential, Chi-squared)
- 베타 분포 (Beta Distribution)
관련 개념
- 적률과 적률생성함수 — MGF로 분포를 특성화
- 확률변수 함수의 분포 — 정규 → 카이제곱 변환
- MLE — 연속 분포의 모수 추정