연속 분포 — 정규, 감마, 베타, 코시, 로그정규 이론과 실무

Casella & Berger Ch.3 — 핵심 연속 분포의 PDF, 평균, 분산, MGF, 상호 관계

통계학에서 자주 사용되는 핵심 연속 분포를 체계적으로 정리한다. 정규, 감마(지수·카이제곱 포함), 베타, 코시, 로그정규 분포의 수학적 정의와 성질, 상호 관계, 그리고 데이터 사이언스 실무에서의 응용을 다룬다.

Statistics
저자

Kwangmin Kim

공개

2026년 03월 29일

1 왜 연속 분포인가

이산 분포가 셀 수 있는 결과를 모델링한다면, 연속 분포는 측정값·길이·시간·비율처럼 실수 직선(또는 그 일부) 위에 놓이는 현상을 모델링한다. 연속 분포에서 확률은 밀도 함수(PDF)의 적분으로 주어진다:

\[ P(a \le X \le b) = \int_a^b f_X(x) \, dx \]

직관: 왜 확률이 적분인가

이산 분포에서는 각 값의 확률을 더한다. 연속 분포에서는 단일 점의 확률이 0이므로(구간의 길이가 0이기 때문), “더한다”는 개념이 적분으로 바뀐다.

\(f_X(x)\) 를 “밀도”라고 부르는 이유가 여기 있다 — 밀도는 얼마나 확률이 그 근방에 밀집해 있는지를 나타낸다. 아주 좁은 구간 \([x, x+dx]\) 의 확률은 \(f_X(x) \cdot dx\) 로 근사된다. 이 작은 직사각형들을 모두 더하면(적분하면) 전체 확률이 된다.

반사실: 만약 모든 점에 양수 확률을 부여하면 비가산 무한 개의 양수를 더해야 하므로 합이 무한대가 된다. 따라서 연속 분포에서는 개별 점 대신 구간에 대한 확률만 의미를 갖는다.

아래 표는 이 포스트에서 다루는 핵심 연속 분포를 한눈에 정리한다.

분포 표기 지지 집합 핵심 역할
연속균등 \(\text{Uniform}(a,b)\) \([a,b]\) 무정보 사전분포, PIT, 난수 생성 기반
정규 \(N(\mu, \sigma^2)\) \((-\infty, \infty)\) CLT 극한 분포, 오차 모델링의 표준
감마 \(\text{Gamma}(\alpha, \beta)\) \((0, \infty)\) 대기시간, 적률, 베이지안 켤레 사전분포
지수 \(\text{Exp}(\beta)\) \((0, \infty)\) 감마의 특수 케이스(\(\alpha=1\)), 무기억성
카이제곱 \(\chi^2(\nu)\) \((0, \infty)\) 감마의 특수 케이스, 검정 통계량 분포
베타 \(\text{Beta}(\alpha, \beta)\) \((0, 1)\) 비율 모델링, 베이지안 이항 켤레 사전분포
코시 \(\text{Cauchy}(\theta, \sigma)\) \((-\infty, \infty)\) 중꼬리 분포, 평균·분산 미존재
로그정규 \(\text{LogNormal}(\mu, \sigma^2)\) \((0, \infty)\) 소득·주가·생물학적 측정

2 정규 분포 (Normal Distribution)

2.1 정의

정의: 정규 분포

\(X \sim N(\mu, \sigma^2)\) 이면 PDF는:

\[ f_X(x \mid \mu, \sigma^2) = \frac{1}{\sqrt{2\pi}\,\sigma} \exp\!\left(-\frac{(x-\mu)^2}{2\sigma^2}\right), \quad x \in \mathbb{R} \]

직관: 정규 PDF의 각 항이 하는 역할

\[\frac{1}{\sqrt{2\pi}\,\sigma} \cdot \exp\!\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)\]

  • \(\exp(-\cdots)\): 지수 함수의 인수가 음수이므로, 중심에서 멀어질수록 밀도가 급격히 0에 가까워진다. \((x-\mu)^2\) 이 이차식이므로 감소 속도는 거리의 제곱에 비례한다 — 이것이 종 모양 대칭 곡선의 원인이다.
  • \((x-\mu)^2\): 제곱 덕분에 양쪽 방향으로 동일하게 감소한다. 만약 \(|x-\mu|\) 처럼 절댓값을 썼다면 라플라스 분포(뾰족한 봉우리)가 된다.
  • \(2\sigma^2\) 분모: \(\sigma\) 가 클수록 지수 인수가 천천히 감소 → 곡선이 옆으로 넓게 퍼진다. \(\sigma\) 가 작을수록 급격히 감소 → 날카로운 봉우리가 된다.
  • \(1/(\sqrt{2\pi}\sigma)\): 전체 면적이 1이 되도록 정규화하는 상수이다. \(\sqrt{2\pi}\) 는 가우시안 적분 \(\int e^{-z^2/2}dz = \sqrt{2\pi}\) 에서 나온다.
  • \(\mu \in \mathbb{R}\): 위치 모수 (평균)
  • \(\sigma^2 > 0\): 척도 모수 (분산)

표준 정규: \(Z \sim N(0,1)\), PDF를 \(\phi(z)\), CDF를 \(\Phi(z)\)로 표기한다.

2.2 성질

성질
평균 \(E[X]\) \(\mu\)
분산 \(\text{Var}(X)\) \(\sigma^2\)
MGF \(M_X(t)\) \(\exp(\mu t + \sigma^2 t^2/2)\)
중위수 = 최빈값 \(\mu\)
지수족 여부 O
위치-척도족 여부 O

정규화 상수 \(\sqrt{2\pi}\)의 유도: 가우시안 적분 \(\int_{-\infty}^\infty e^{-x^2/2} dx = \sqrt{2\pi}\) 를 이용한다 (Casella & Berger, 2002, Ch.3).

2.3 선형 변환 닫힘성

\(X \sim N(\mu, \sigma^2)\) 이면:

\[ aX + b \sim N(a\mu + b,\ a^2\sigma^2) \]

독립 정규 합: \(X_i \sim N(\mu_i, \sigma_i^2)\) 독립이면 \(\sum X_i \sim N(\sum \mu_i, \sum \sigma_i^2)\).

2.4 표준화와 CDF

\[ Z = \frac{X - \mu}{\sigma} \sim N(0,1), \quad P(X \le x) = \Phi\!\left(\frac{x-\mu}{\sigma}\right) \]

\(\Phi\)는 닫힌 형식이 없어 수치적으로 계산하거나 표를 이용한다.

2.5 68-95-99.7 규칙

\[ P(\mu - k\sigma \le X \le \mu + k\sigma) \approx \begin{cases} 0.6827 & k=1 \\ 0.9545 & k=2 \\ 0.9973 & k=3 \end{cases} \]

2.6 왜 정규 분포인가

중심극한정리(CLT)에 따르면, 유한 분산을 갖는 iid 확률변수의 표준화 합은 정규 분포로 수렴한다:

\[ \frac{\bar{X}_n - \mu}{\sigma/\sqrt{n}} \xrightarrow{d} N(0,1) \quad (n \to \infty) \]

따라서 정규 분포는 특정 현상의 분포가 아니라 반복 측정의 극한 거동을 기술하는 도구이다.


3 감마 분포 (Gamma Distribution)

3.1 감마 함수

감마 분포의 정규화 상수는 감마 함수(Gamma function)에 기반한다:

\[ \Gamma(\alpha) = \int_0^\infty t^{\alpha-1} e^{-t} \, dt, \quad \alpha > 0 \]

핵심 성질: - \(\Gamma(\alpha+1) = \alpha \, \Gamma(\alpha)\) (재귀 관계) - \(\Gamma(n) = (n-1)!\) (\(n\) 양의 정수) - \(\Gamma(1/2) = \sqrt{\pi}\)

3.2 정의

정의: 감마 분포

\(X \sim \text{Gamma}(\alpha, \beta)\) 이면 PDF는:

\[ f_X(x \mid \alpha, \beta) = \frac{1}{\Gamma(\alpha)\,\beta^\alpha} x^{\alpha-1} e^{-x/\beta}, \quad x > 0 \]

직관: 감마 PDF의 각 항이 하는 역할

\[\frac{1}{\Gamma(\alpha)\beta^\alpha} \cdot x^{\alpha-1} \cdot e^{-x/\beta}\]

  • \(x^{\alpha-1}\) 항 (형상 모수 \(\alpha\)): \(\alpha > 1\) 이면 \(x=0\) 에서 밀도가 0이고 내부에서 봉우리가 생긴다. \(\alpha = 1\) 이면 \(x^0 = 1\) 이므로 단조감소하는 지수 분포가 된다. \(\alpha\) 가 클수록 분포가 오른쪽으로 이동하고 더 대칭적인 모양이 된다.
  • \(e^{-x/\beta}\) 항 (척도 모수 \(\beta\)): \(x\) 가 커질수록 밀도를 0으로 당기는 감쇠 항이다. \(\beta\) 가 클수록 감쇠가 느려져 분포가 오른쪽으로 늘어진다.
  • 두 항의 경쟁: \(x^{\alpha-1}\)\(x\) 가 커질수록 증가하고, \(e^{-x/\beta}\) 는 감소한다. 이 두 힘의 균형 지점이 최빈값 \((\alpha-1)\beta\) 이다.
  • 포아송 과정에서 \(k\)번째 이벤트까지의 대기 시간이 \(\text{Gamma}(k, 1/\lambda)\) 를 따르는 이유는, \(k\) 번의 지수 분포 대기를 합산한 결과이기 때문이다.
  • \(\alpha > 0\): 형상 모수(shape parameter)
  • \(\beta > 0\): 척도 모수(scale parameter)

주의: 일부 교재·소프트웨어는 rate parameter \(\lambda = 1/\beta\)를 사용한다. 문맥을 확인한다.

3.3 성질

성질
평균 \(E[X]\) \(\alpha\beta\)
분산 \(\text{Var}(X)\) \(\alpha\beta^2\)
MGF \(M_X(t)\) \((1 - \beta t)^{-\alpha}\), \(t < 1/\beta\)
지수족 여부 O

감마의 닫힘성(Closure): 독립 \(X_i \sim \text{Gamma}(\alpha_i, \beta)\)이면 \(\sum X_i \sim \text{Gamma}(\sum \alpha_i, \beta)\).

3.4 특수 케이스

지수 분포 (Exponential Distribution)

\[ X \sim \text{Exp}(\beta) \iff X \sim \text{Gamma}(1, \beta) \]

\[ f_X(x) = \frac{1}{\beta} e^{-x/\beta}, \quad x > 0 \]

  • \(E[X] = \beta\), \(\text{Var}(X) = \beta^2\)
  • 무기억성: \(P(X > s+t \mid X > s) = P(X > t)\) — 지수 분포의 고유 성질
  • 연속 분포 중 무기억성을 갖는 유일한 분포이다
  • 응용: 고장 시간, 대기 시간 모델링

카이제곱 분포 (Chi-squared Distribution)

\[ X \sim \chi^2(\nu) \iff X \sim \text{Gamma}(\nu/2,\ 2) \]

\[ f_X(x) = \frac{1}{2^{\nu/2}\,\Gamma(\nu/2)} x^{\nu/2-1} e^{-x/2}, \quad x > 0 \]

  • \(\nu\): 자유도 (degrees of freedom)
  • \(E[X] = \nu\), \(\text{Var}(X) = 2\nu\)
  • 독립 표준정규 합의 제곱: \(Z_1, \ldots, Z_\nu \sim N(0,1)\) 독립이면 \(\sum Z_i^2 \sim \chi^2(\nu)\)
  • 응용: 적합도 검정, 분산 추정, 신뢰구간
감마 분포 가족 관계

\[ \text{Gamma}(\alpha, \beta) \begin{cases} \alpha = 1 \Rightarrow \text{Exp}(\beta) \\ \alpha = \nu/2,\ \beta = 2 \Rightarrow \chi^2(\nu) \end{cases} \]

포아송 과정에서 \(k\)번째 사건까지의 대기 시간 \(\sim \text{Gamma}(k, 1/\lambda)\) (rate \(\lambda\)).


4 베타 분포 (Beta Distribution)

4.1 베타 함수

\[ B(\alpha, \beta) = \int_0^1 t^{\alpha-1}(1-t)^{\beta-1} \, dt = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)} \]

4.2 정의

정의: 베타 분포

\(X \sim \text{Beta}(\alpha, \beta)\) 이면 PDF는:

\[ f_X(x \mid \alpha, \beta) = \frac{1}{B(\alpha,\beta)} x^{\alpha-1}(1-x)^{\beta-1}, \quad x \in (0,1) \]

직관: 베타 PDF의 각 항이 하는 역할

\[\frac{1}{B(\alpha,\beta)} \cdot x^{\alpha-1} \cdot (1-x)^{\beta-1}\]

  • \(x^{\alpha-1}\): \(x=0\) 근방의 밀도를 결정한다. \(\alpha > 1\) 이면 \(x=0\) 에서 밀도가 0 (0을 기피), \(\alpha < 1\) 이면 0 근방에서 밀도가 폭발적으로 증가 (0을 선호), \(\alpha = 1\) 이면 중립.
  • \((1-x)^{\beta-1}\): 같은 방식으로 \(x=1\) 근방의 밀도를 결정한다. \(\beta\) 가 클수록 1 근방을 기피한다.
  • 대칭성: \(\alpha = \beta\) 이면 두 항이 대칭이므로 분포가 0.5를 중심으로 대칭이다. \(\alpha > \beta\) 이면 오른쪽에 더 높은 밀도 (높은 값 선호), \(\alpha < \beta\) 이면 왼쪽에 더 높은 밀도.
  • 베이지안 해석: 성공률 \(p\) 에 대한 사전 정보가 없을 때 \(\text{Beta}(1,1) = \text{Uniform}(0,1)\) 을 쓴다. \(n\) 번 시행에서 \(s\) 번 성공한 후 사후 분포는 \(\text{Beta}(1+s, 1+n-s)\) 가 된다 — \(\alpha\) 는 “관찰된 성공 수 + 1”, \(\beta\) 는 “관찰된 실패 수 + 1”로 해석된다.
  • \(\alpha, \beta > 0\): 형상 모수

4.3 성질

성질
평균 \(E[X]\) \(\dfrac{\alpha}{\alpha+\beta}\)
분산 \(\text{Var}(X)\) \(\dfrac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}\)
MGF 닫힌 형식 없음 (초기하급수)
지수족 여부 O

4.4 형상 모수에 따른 형태

\(\alpha\), \(\beta\) 관계 분포 형태
\(\alpha = \beta = 1\) 균등 분포 \(\text{Uniform}(0,1)\)
\(\alpha = \beta > 1\) 대칭 종 모양
\(\alpha > \beta\) 오른쪽 치우침 (우편향)
\(\alpha < \beta\) 왼쪽 치우침 (좌편향)
\(\alpha, \beta < 1\) U자형

4.5 왜 베타 분포인가

비율(proportion), 확률, 순서통계량 등 \((0,1)\) 구간의 값을 모델링하는 데 자연스러운 분포이다.

  • 베이지안 이항 켤레 사전분포: 이항 가능도에 베타 사전분포를 쓰면 사후분포도 베타이다
  • 균등 분포의 일반화: \(\text{Beta}(1,1) = \text{Uniform}(0,1)\)
  • 균등 분포의 순서통계량: \(X_{(k)} \sim \text{Beta}(k, n-k+1)\)

5 코시 분포 (Cauchy Distribution)

5.1 정의

정의: 코시 분포

\(X \sim \text{Cauchy}(\theta, \sigma)\) 이면 PDF는:

\[ f_X(x \mid \theta, \sigma) = \frac{1}{\pi\sigma\left[1 + \left(\frac{x-\theta}{\sigma}\right)^2\right]}, \quad x \in \mathbb{R} \]

직관: 코시 분포 — 왜 꼬리가 이렇게 두꺼운가

코시 PDF의 분모는 \(1 + \left(\frac{x-\theta}{\sigma}\right)^2\) 이다. 이것은 \(|x|\) 가 커질수록 \(x^2\) 에 비례해서 커진다 — 밀도가 \(1/x^2\) 속도로 감소한다는 뜻이다.

반면 정규 분포는 \(e^{-x^2/2}\) 속도로 감소하는데, 지수 함수가 다항 함수보다 훨씬 빠르게 감소한다. 따라서 코시 분포의 꼬리는 정규 분포보다 훨씬 두껍다.

꼬리가 두꺼우면 왜 평균이 없는가: 평균을 계산하려면 \(\int |x| f(x) dx\) 가 유한해야 한다. 코시의 경우 \(\int |x| \cdot \frac{1}{1+x^2} dx \sim \int \frac{|x|}{x^2} dx = \int \frac{1}{|x|} dx\) 인데, 이 적분은 발산한다. \(1/x^2\) 감소가 \(|x|\) 증가를 상쇄하기에 충분하지 않기 때문이다.

직관적 비유: 코시 분포를 따르는 값의 평균을 아무리 많은 표본으로 추정해도, 표본 평균은 수렴하지 않는다. 극단적 이상치가 너무 자주 나타나 표본 평균을 계속 끌어당기기 때문이다.

  • \(\theta \in \mathbb{R}\): 위치 모수 (중위수이자 최빈값)
  • \(\sigma > 0\): 척도 모수

5.2 특이성: 평균과 분산이 존재하지 않는다

코시 분포는 꼬리가 매우 두꺼워 \(\int |x| f(x) dx = \infty\) 이므로 \(E[X]\)가 존재하지 않는다.

\[ E[|X|] = \infty \Rightarrow E[X] \text{ 미존재} \]

따라서 분산과 MGF도 존재하지 않는다. 중꼬리(heavy-tail) 분포의 대표적 예이다.

표준 코시: \(Z = X/Y\) (\(X, Y \sim N(0,1)\) 독립) \(\sim \text{Cauchy}(0,1)\).

표준 코시는 자유도 1인 \(t\) 분포와 동일하다: \(\text{Cauchy}(0,1) = t(1)\).

5.3 왜 코시 분포인가

  • 중심극한정리가 적용되지 않는 반례 — iid 코시 표본 평균도 코시 분포를 따른다
  • 로버스트 회귀, 신호처리에서 이상치(outlier)가 많은 오차 모형으로 사용된다
  • 물리학에서 공명(resonance) 현상의 선폭(line width) 모형 (로렌츠 분포)

6 로그정규 분포 (Log-normal Distribution)

6.1 정의

정의: 로그정규 분포

\(X > 0\) 이고 \(\log X \sim N(\mu, \sigma^2)\) 이면 \(X \sim \text{LogNormal}(\mu, \sigma^2)\):

\[ f_X(x \mid \mu, \sigma^2) = \frac{1}{x\sqrt{2\pi}\,\sigma} \exp\!\left(-\frac{(\log x - \mu)^2}{2\sigma^2}\right), \quad x > 0 \]

직관: 로그정규 PDF — 왜 이런 형태인가

로그정규 분포의 PDF는 정규 분포의 PDF에서 변수 변환 \(x \to \log x\) 를 적용한 결과이다.

\[f_X(x) = f_Z(\log x) \cdot \left|\frac{d(\log x)}{dx}\right| = \phi\!\left(\frac{\log x - \mu}{\sigma}\right) \cdot \frac{1}{x\sigma}\]

  • \(1/x\): 변수 변환의 야코비안이다. \(x\) 가 작을수록 \(\log x\) 의 변화율이 크므로(도함수 \(1/x\) 가 크다), 작은 \(x\) 근방에 더 많은 확률 질량이 밀집된다.
  • \(\exp(-(\log x - \mu)^2/...)\): 로그 척도에서 정규 분포의 종 모양을 만든다.
  • 항상 오른쪽 치우침: 로그 변환의 비대칭성 때문에 선형 척도에서는 항상 긴 오른쪽 꼬리가 생긴다. 평균 \(e^{\mu+\sigma^2/2} >\) 중위수 \(e^\mu >\) 최빈값 \(e^{\mu-\sigma^2}\) 순서가 항상 성립한다.

직관적 비유: 소득, 주가, 세균 수처럼 “더하기”가 아니라 “곱하기”로 성장하는 현상이 로그정규를 따른다. 소득이 매년 5%~20% 성장(곱셈적)하면, 수십 년 후 소득의 로그 값은 정규 분포에 가까워진다(CLT의 곱셈 버전).

6.2 성질

성질
평균 \(E[X]\) \(e^{\mu + \sigma^2/2}\)
분산 \(\text{Var}(X)\) \((e^{\sigma^2}-1)\,e^{2\mu+\sigma^2}\)
중위수 \(e^\mu\)
최빈값 \(e^{\mu - \sigma^2}\)

평균 \(>\) 중위수 \(>\) 최빈값 — 항상 오른쪽 치우침이다.

6.3 왜 로그정규 분포인가

로그를 취하면 정규가 되는 현상에 등장한다:

  • 소득 분포, 주가 수익률 (곱셈적 성장)
  • 생물학적 측정 (세포 크기, 박테리아 수)
  • 생존 분석에서 생존 시간

정규 분포가 덧셈의 극한이라면, 로그정규 분포는 곱셈의 극한이다.


7 이중지수 분포 / 라플라스 분포 (Laplace Distribution)

::: {.callout-note} ## 정의: 라플라스 분포

\(X \sim \text{Laplace}(\mu, b)\) 이면:

\[ f_X(x) = \frac{1}{2b} \exp\!\left(-\frac{|x - \mu|}{b}\right), \quad x \in \mathbb{R} \]

직관: 라플라스 분포 — 절댓값이 만드는 날카로운 봉우리

라플라스 PDF의 핵심은 지수 함수의 인수에 \(|x - \mu|\) (절댓값)가 들어간다는 점이다.

  • 정규 분포는 \((x-\mu)^2\) (이차식) 을 사용 → 봉우리 근방에서 완만하게 감소 (이차 곡선처럼 매끄러운 산 모양)
  • 라플라스 분포는 \(|x-\mu|\) (일차 절댓값) 을 사용 → \(x = \mu\) 에서 날카로운 꺾임 발생, 봉우리가 뾰족함
  • 라플라스는 정규보다 중심에 더 집중되어 있고(뾰족), 동시에 꼬리도 더 두꺼워서 이상치가 더 자주 나온다.

Lasso 회귀와의 연결: Lasso의 L1 페널티 \(\lambda \sum |\beta_j|\) 는 회귀 계수 \(\beta\) 에 라플라스 사전분포를 부여하는 것과 동일하다. \(|x-0|\) 형태의 라플라스 분포는 0에서 날카로운 봉우리를 가지므로, MAP 추정이 많은 계수를 정확히 0으로 추정하도록(희소성) 유도한다.

  • \(E[X] = \mu\), \(\text{Var}(X) = 2b^2\)
  • 정규보다 뾰족하고 꼬리가 두꺼운 레프토커틱(leptokurtic) 분포
  • Lasso 회귀(L1 페널티)는 라플라스 사전분포를 MAP 추정으로 해석할 수 있다

8 연속 분포 상호 관계

Uniform(0,1)
    │
    ├─ PIT: 모든 연속 분포로 변환 가능
    │
    └─ Beta(1,1) = Uniform(0,1)

Normal(μ, σ²)
    │
    ├─ exp(Normal) = LogNormal
    ├─ Z²  = Chi²(1)  ──┐
    └─ Z₁/Z₂  = Cauchy(0,1)  │
                            ↓
Gamma(α, β)               Chi²(ν) = Gamma(ν/2, 2)
    │                        │
    └─ α=1: Exp(β)           └─ 표준정규 ν개의 제곱합

Beta(α, β)
    └─ 균등의 순서통계량 X_(k) ~ Beta(k, n-k+1)
변환 관계 설명
\(Z \sim N(0,1) \Rightarrow Z^2 \sim \chi^2(1)\) 카이제곱은 표준정규의 제곱
\(\sum_{i=1}^\nu Z_i^2 \sim \chi^2(\nu)\) 카이제곱의 닫힘성
\(X \sim N, Y \sim \chi^2(\nu) \Rightarrow \frac{X}{\sqrt{Y/\nu}} \sim t(\nu)\) \(t\) 분포 생성
\(\frac{\chi^2(m)/m}{\chi^2(n)/n} \sim F(m,n)\) \(F\) 분포 생성
\(\log X \sim N \Rightarrow X \sim \text{LogNormal}\) 로그-정규 연결
\(\text{Beta}(1,1) = \text{Uniform}(0,1)\) 베타의 특수 케이스
\(\text{Gamma}(1,\beta) = \text{Exp}(\beta)\) 감마의 특수 케이스

9 분포별 성질 요약 테이블

분포 평균 분산 MGF 존재 지지 지수족
\(N(\mu,\sigma^2)\) \(\mu\) \(\sigma^2\) O \(\mathbb{R}\) O
\(\text{Gamma}(\alpha,\beta)\) \(\alpha\beta\) \(\alpha\beta^2\) O (\(t<1/\beta\)) \((0,\infty)\) O
\(\text{Exp}(\beta)\) \(\beta\) \(\beta^2\) O (\(t<1/\beta\)) \((0,\infty)\) O
\(\chi^2(\nu)\) \(\nu\) \(2\nu\) O (\(t<1/2\)) \((0,\infty)\) O
\(\text{Beta}(\alpha,\beta)\) \(\frac{\alpha}{\alpha+\beta}\) \(\frac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}\) O (급수) \((0,1)\) O
\(\text{Cauchy}(\theta,\sigma)\) 미존재 미존재 X \(\mathbb{R}\) X
\(\text{LogNormal}(\mu,\sigma^2)\) \(e^{\mu+\sigma^2/2}\) \((e^{\sigma^2}-1)e^{2\mu+\sigma^2}\) X \((0,\infty)\) X
\(\text{Laplace}(\mu,b)\) \(\mu\) \(2b^2\) O (\(|t|<1/b\)) \(\mathbb{R}\) O

10 코드 예시

10.1 Step 1: 순수 Python — PDF 직접 구현

import math

# 정규 분포 PDF
def normal_pdf(x, mu=0, sigma=1):
    return (1 / (math.sqrt(2 * math.pi) * sigma)) * math.exp(-0.5 * ((x - mu) / sigma) ** 2)

# 감마 분포 PDF (shape=alpha, scale=beta)
def gamma_pdf(x, alpha, beta):
    if x <= 0:
        return 0.0
    return (x ** (alpha - 1) * math.exp(-x / beta)) / (math.gamma(alpha) * beta ** alpha)

# 지수 분포 PDF — Gamma(1, beta)
def exp_pdf(x, beta):
    return gamma_pdf(x, alpha=1, beta=beta)

# 베타 분포 PDF
def beta_func(a, b):
    return math.gamma(a) * math.gamma(b) / math.gamma(a + b)

def beta_pdf(x, alpha, beta):
    if not 0 < x < 1:
        return 0.0
    return x ** (alpha - 1) * (1 - x) ** (beta - 1) / beta_func(alpha, beta)

# 검증: 각 PDF의 대표값 계산
print("=== 정규 분포 N(0,1) ===")
print(f"f(0) = {normal_pdf(0):.6f}  (이론: {1/math.sqrt(2*math.pi):.6f})")

print("\n=== 감마 분포 Gamma(2, 3) ===")
x = 3.0  # 평균 = alpha*beta = 6
print(f"f(3) = {gamma_pdf(3, alpha=2, beta=3):.6f}")
print(f"E[X] = {2*3} (alpha*beta)")

print("\n=== 지수 분포 Exp(2) ===")
print(f"f(1) = {exp_pdf(1, beta=2):.6f}  (이론: {(1/2)*math.exp(-1/2):.6f})")
print(f"무기억성 P(X>3|X>1) = P(X>2): {math.exp(-2/2):.6f}")

print("\n=== 베타 분포 Beta(2,5) ===")
print(f"f(0.2) = {beta_pdf(0.2, alpha=2, beta=5):.6f}")
print(f"E[X] = {2/(2+5):.4f}  (이론: alpha/(alpha+beta))")

10.2 Step 2: scipy.stats — 연속 분포 비교

import numpy as np
from scipy import stats

# 각 분포 객체 생성
distributions = {
    "Normal(0,1)":      stats.norm(loc=0, scale=1),
    "Gamma(2,3)":       stats.gamma(a=2, scale=3),
    "Exp(2)":           stats.expon(scale=2),
    "Chi2(5)":          stats.chi2(df=5),
    "Beta(2,5)":        stats.beta(a=2, b=5),
    "LogNormal(0,0.5)": stats.lognorm(s=0.5, scale=np.exp(0)),
    "Cauchy(0,1)":      stats.cauchy(loc=0, scale=1),
}

print(f"{'분포':<22} {'Mean':>10} {'Var':>12} {'Median':>10}")
print("-" * 58)
for name, dist in distributions.items():
    try:
        mean = dist.mean()
        var  = dist.var()
        med  = dist.median()
        print(f"{name:<22} {mean:>10.4f} {var:>12.4f} {med:>10.4f}")
    except Exception:
        print(f"{name:<22} {'N/A':>10} {'N/A':>12} {'N/A':>10}")
분포                       Mean          Var     Median
----------------------------------------------------------
Normal(0,1)                0.0000       1.0000     0.0000
Gamma(2,3)                 6.0000      18.0000     5.3063
Exp(2)                     2.0000       4.0000     1.3863
Chi2(5)                    5.0000      10.0000     4.3515
Beta(2,5)                  0.2857       0.0255     0.2633
LogNormal(0,0.5)           1.1331       0.3524     1.0000
Cauchy(0,1)                   N/A          N/A     0.0000

10.3 Step 3: 분포 선택 가이드 — 데이터 유형별

import numpy as np
from scipy import stats

# 시나리오 1: 양수 대기 시간 데이터 → 감마/지수 적합
np.random.seed(42)
wait_times = np.random.exponential(scale=5, size=200)  # 평균 5분 대기

# 지수 분포 적합
scale_hat = wait_times.mean()  # MLE: beta = x_bar
ks_stat, p_value = stats.kstest(wait_times, 'expon', args=(0, scale_hat))
print(f"=== 대기 시간 → 지수 분포 적합 ===")
print(f"MLE scale = {scale_hat:.3f}  (참: 5.0)")
print(f"KS test p-value = {p_value:.4f}  ({'적합' if p_value > 0.05 else '부적합'})")

# 시나리오 2: 비율 데이터 → 베타 적합
click_rates = np.random.beta(a=2, b=8, size=200)  # 전환율 ~ Beta(2,8)
alpha_hat, beta_hat, _, _ = stats.beta.fit(click_rates, floc=0, fscale=1)
print(f"\n=== 전환율 → 베타 분포 적합 ===")
print(f"MLE alpha = {alpha_hat:.3f} (참: 2.0),  beta = {beta_hat:.3f} (참: 8.0)")
print(f"E[X] = {alpha_hat/(alpha_hat+beta_hat):.4f}  (참: {2/(2+8):.4f})")

# 시나리오 3: 양수 데이터가 곱셈적 구조 → 로그정규
incomes = np.random.lognormal(mean=10.5, sigma=0.8, size=500)
mu_hat = np.log(incomes).mean()
sigma_hat = np.log(incomes).std()
print(f"\n=== 소득 데이터 → 로그정규 적합 ===")
print(f"MLE mu = {mu_hat:.3f} (참: 10.5),  sigma = {sigma_hat:.3f} (참: 0.8)")
print(f"중위수 = {np.exp(mu_hat):.1f},  평균 = {np.exp(mu_hat + sigma_hat**2/2):.1f}")

11 분포 선택 지침

어떤 연속 분포를 선택할지는 데이터의 지지 집합과 형태에 따라 결정된다:

데이터 특성 후보 분포 이유
\((-\infty, \infty)\), 대칭, 가벼운 꼬리 Normal CLT, 오차 모델
\((-\infty, \infty)\), 대칭, 무거운 꼬리 Cauchy, \(t(\nu)\) 이상치 내성
\((0, \infty)\), 양의 치우침 Gamma, LogNormal 대기시간, 소득
\((0, \infty)\), 무기억성 Exponential 포아송 과정 간격
\((0, 1)\), 비율·확률 Beta 이항 켤레
검정 통계량 \(\chi^2\), \(t\), \(F\) 표본 분포 이론

12 관련 주제

선행 지식

후속 주제 (개별 포스트)

관련 개념

Subscribe

Enjoy this blog? Get notified of new posts by email: